Един филм, който обичах като дете, беше класиката от 1986 г. "Късо съединение". В една сцена Джони Файв, невероятният робот, който оживява, след като е ударен от мълния, поглъща книга след книга, прекарвайки само секунди върху всяко заглавие. Скоро той свършва всички книги. "Ааа! Повече информация, Стефани! Още!"
„Няма нищо повече!“ отговаря Стефани, жената, която го намери. „Ти прочете всичко в къщата!“
Попитах ChatGPT на OpenAI дали може да разбере сцената. „Абсолютно – напълно съчувствам на Джони Файв“, отговори то. "„Нуждая се от информация!“ е основното ми настроение. Колкото повече информация получавам, толкова по-добре разбирам, отговарям и се свързвам. Джони беше просто изкуствен интелект, който се опитваше да осмисли света... същото е и с мен, само с по-малко лазерни лъчи и повече писане."
И това е вярно. Въпреки че ChatGPT не се движи на гъсенични вериги и няма лазерен пистолет, закрепен на гърба си (все още), предизвикателствата пред него са напълно идентични. След като са събрали почти цялото човешко знание, ChatGPT и други усилия за AI надават същия вик: Нуждаем се от информация!
Едно решение е да се създадат синтетични данни и да се обучи модел върху тях, въпреки че това идва с присъщи предизвикателства, особено около поддържането на пристрастия или въвеждането на усложняващи се неточности.
Другото решение е да се намери страхотен извор от нови и свежи данни, колкото по-„човешки“, толкова по-добре. Това е мястото, където се намесват социалните мрежи, цифрови пространства, където милиони, дори милиарди потребители доброволно и постоянно публикуват купища информация. Снимки, публикации, новинарски статии, коментари — всяко взаимодействие от интерес за компании, които се опитват да изградят разговорен и генеративен AI. Още по-добре, това съдържание не е изпълнено с риска от нарушаване на авторски права, който идва с използването на други източници.
Напоследък водещите AI компании преминаха по-агресивно към притежаване или използване на социални мрежи, потъпквайки правата на потребителите да диктуват как техните публикации могат да бъдат използвани за изграждане на тези машини. Потребителите на социалните мрежи отдавна са „продуктът“, както се казва в известната поговорка. Сега те също са квази-„разработчик на продукти“ чрез своите публикации.
Някои компании можеха да използват социалните мрежи от самото си начало. Meta Platforms Inc., най-голямата компания за социални мрежи на планетата, използва известия в приложението, за да информира потребителите, че ще използва техните публикации и снимки за своите модели Llama AI. В края на миналия месец xAI на Илон Мъск придоби X, бивш Twitter, което беше преди всичко финансова хитрост, но имаше идеален смисъл за Grok AI на Мъск. Той успя да навлезе на пазара на чатботове, като използва навременни туитове, публикувани в мрежата, както и огромния архив от онлайн чатове, датиращи от почти две десетилетия. След това имате Microsoft Corp., която притежава професионалната мрежа LinkedIn и настоява усилено потребителите (и журналистите) да публикуват повече и повече оригинално съдържание в платформата.
Microsoft обаче не споделя данни от LinkedIn с близкия си партньор OpenAI, което може да обясни новините, че създателят на ChatGPT е в ранните етапи на изграждане на собствена социална мрежа.
Главният изпълнителен директор и съосновател на Open AI, Сам Алтман, иска обратна връзка за идеята, съобщава The Verge, отбелязвайки, че Алтман по-рано намекна, че обмисля такъв проект, когато беше съобщено, че Meta ще пусне самостоятелно приложение за изкуствен интелект, което да се конкурира с ChatGPT.
Други компании без предимство в социалните мрежи осъзнават, че това ги поставя в неравностойно положение. Perplexity.ai през март направи публична офертата си за закупуване на TikTok, като отбеляза стойността му за компания, която създава търсачка с изкуствен интелект. „Това ще предостави на потребителите изчерпателни, добре цитирани отговори, които съчетават най-добрата система за отговори в света с една от най-големите библиотеки с генерирано от потребителите съдържание“, каза компанията.
По-рано този месец беше съобщено, че Amazon.com Inc. също е сред кандидатите, въпреки че главният изпълнителен директор Анди Джаси отказа коментар, когато беше попитан директно от CNBC.
Google, която се опита и не успя да създаде различни социални мрежи, има по-малка нужда от видеоклипове в TikTok, тъй като вече притежава YouTube. Вместо това, компанията е въвела „разширено партньорство“ с Reddit, социалната мрежа за споделяне на връзки, което ѝ дава достъп, каза Google в публикация в блог миналата година, до „невероятно разнообразие от автентични, човешки разговори и преживявания“. Очаквайте повече сделки като тази: бивш конкурент на Reddit, Digg, се възстановява с очевидното намерение да създаде друго хранилище на човешки взаимодействия, което ще бъде от полза за AI компаниите.
Всички тези ходове говорят за търсенето на данни от AI компаниите. Това е за сметка на потребители, които са въвели информация в социалните мрежи с една цел, а сега осъзнават, че тя ще бъде използвана за друга. Тихомълком, компаниите променят политиките за поверителност, за да покрият законността на тази промяна.
Дълбоко скрити в настройките можете да намерите начини да изолирате данните си от използване за изграждане на AI - въпреки че вероятно вече сте закъснели. Подобно на Джони Файв, компаниите с изкуствен интелект „се нуждаят от информация!“ Те ще я получат както и откъдето могат.
Дейв Лий е технологичен колумнист на Bloomberg Opinion за САЩ. Преди това е бил кореспондент на Financial Times и BBC News.