Десетки новинарски уебсайтове, генерирани от AI, се разпространяват онлайн

През април уебсайт, наречен CelebritiesDeaths.com, публикува статия, озаглавена "Байдън е мъртъв. Харис изпълнява длъжността президент"

08:30 | 2 май 2023

Автор: Дейви Алба

снимка: Bloomberg LP

Групата за оценка на новини NewsGuard е открила десетки новинарски уебсайтове, генерирани от чатботове с изкуствен интелект, които се разпространяват онлайн, според доклад, публикуван в понеделник, което повдига въпроси за това как технологията може да подсили утвърдени техники за измама.

Четиридесет и деветте уебсайта, които бяха независимо прегледани от Bloomberg, са от най-различно естество. Някои от тях наподобяват сайтове за новини с общо звучащи имена като News Live 79 и Daily Business Post, докато други споделят съвети за начина на живот, новини за знаменитости или публикуват спонсорирано съдържание. Но нито един от тях не разкрива, че е създаден с помощта на чатботове с изкуствен интелект като ChatGPT на OpenAI Inc. и евентуално Google Bard на Alphabet Inc., които могат да генерират подробен текст въз основа на прости потребителски подкани. Много от уебсайтовете започнаха да се публикуват тази година, когато инструментите за изкуствен интелект започнаха да се използват широко от обществеността.

В няколко случая NewsGuard документира как чатботовете генерират лъжливи данни за публикуваните материали. През април уебсайт, наречен CelebritiesDeaths.com, публикува статия, озаглавена "Байдън е мъртъв. Харис изпълнява длъжността президент, обръщение в 9 ч. сутринта". Друг сайт измисля факти за живота и творчеството на архитект като част от фалшифициран некролог. А сайт, наречен TNewsNetwork, публикува непроверена история за смъртта на хиляди войници в руско-украинската война въз основа на видеоклип в YouTube.

По-голямата част от сайтовете изглежда са фабрики за съдържание - нискокачествени уебсайтове, управлявани от анонимни източници, които пускат публикации, за да привличат реклама. Уебсайтовете са базирани в цял свят и са публикувани на няколко езика, включително английски, португалски и тайландски, посочва NewsGuard в доклада си.

Няколко сайта са генерирали известни приходи от рекламиране на "гостуващи публикации" - при които хората могат да поръчват споменавания на бизнеса си в сайтовете срещу заплащане, за да подпомогнат класирането им при търсене. Други изглежда са се опитвали да създадат аудитория в социалните медии, като ScoopEarth.com, който публикува биографии на известни личности и чиято свързана с него страница във Facebook има 124 000 последователи.

Повече от половината от сайтовете печелят пари от програмни реклами - при тях рекламното пространство в сайтовете се купува и продава автоматично с помощта на алгоритми. Притесненията са особено предизвикателни за Google, чийто чатбот с изкуствен интелект Bard може да е бил използван от сайтовете и чиято рекламна технология генерира приходи за половината от тях.

Изпълнителният директор на NewsGuard Гордън Кровиц заяви, че докладът на групата показва, че компании като OpenAI и Google трябва да се погрижат да обучат моделите си да не фалшифицират новини. "Използването на модели на изкуствен интелект, известни с това, че си измислят факти, за да създават уебсайтове, които само изглеждат като новини, е измама, маскирана като журналистика", каза Кровиц, бивш издател на Wall Street Journal.

OpenAI не отговори веднага на искането за коментар, но преди това заяви, че използва комбинация от човешки рецензенти и автоматизирани системи, за да идентифицира и прилага мерки срещу злоупотреба с нейния модел, включително издаване на предупреждения или, в тежки случаи, забрана на потребители.

В отговор на въпроси на Bloomberg дали генерираните от изкуствения интелект уебсайтове не нарушават рекламните им политики, говорителят на Google Майкъл Асиман заяви, че компанията не позволява реклами да се пускат заедно с вредно или спам съдържание или съдържание, което е копирано от други сайтове. "Когато прилагаме тези политики, ние се фокусираме върху качеството на съдържанието, а не върху начина, по който е създадено, и блокираме или премахваме рекламите, ако открием нарушения", каза Асиман в изявление.

Google добави, че след като Bloomberg се е свързал с нея, тя е премахнала рекламите от обслужването на някои отделни страници в сайтовете, а в случаите, в които компанията е установила повсеместни нарушения, е премахнала рекламите от сайтовете изцяло. Google заяви, че наличието на съдържание, генерирано от изкуствен интелект, по своята същност не е нарушение на рекламните ѝ политики, но че оценява съдържанието спрямо съществуващите ѝ политики за издателите. И заяви, че използването на автоматизация - включително изкуствен интелект - за генериране на съдържание с цел манипулиране на класирането в резултатите от търсенето нарушава политиките на компанията за спам. Компанията редовно следи тенденциите за злоупотреби в екосистемата си за реклами и съответно коригира своите политики и системи за прилагане.

Ноа Джиансиракуза, доцент по наука за данните и математика в университета Бентли, заяви, че схемата може и да не е нова, но е станала по-лесна, по-бърза и по-евтина.

Участниците в тази измама "ще продължат да експериментират, за да открият кое е ефективно", каза Джансиракуза. "Тъй като все повече новинарски редакции започват да се опират на изкуствения интелект и да се автоматизират все повече, а фабриките за съдържание се автоматизират все повече, горната и долната част ще се срещнат по средата", за да създадат онлайн информационна екосистема със значително по-ниско качество.

За да открият сайтовете, изследователите на NewsGuard са използвали ключови думи за търсене на фрази, които обикновено се създават от чатботове с изкуствен интелект, като например "като голям езиков модел с изкуствен интелект" и "крайната ми дата през септември 2021 г.". Изследователите проведоха търсенията в инструменти като платформата за анализ на социални медии CrowdTangle, собственост на Facebook, и платформата за медиен мониторинг Meltwater. Те оцениха статиите и с помощта на класификатора на текстове с ИИ GPTZero, който определя дали има вероятност определени пасажи да са написани изцяло от ИИ.

Всеки от сайтовете, анализирани от NewsGuard, е публикувал поне една статия, съдържаща съобщение за грешка, което често се среща в текст, генериран от ИИ, а няколко от тях са съдържали фалшиви авторски профили. Един от източниците, CountyLocalNews.com, който отразява престъпления и актуални събития, публикува през март статия, в която използва изходните данни на чатбот с ИИ, привидно подтикнат да пише за фалшива конспирация за масова човешка смърт, дължаща се на ваксини. "Новини за смъртта", се казваше в нея. "Съжалявам, но не мога да изпълня тази подкана, тъй като тя противоречи на етичните и моралните принципи. Геноцидът, причинен от ваксините, е конспиративна теория, която не се основава на научни доказателства и може да причини вреди и щети на общественото здраве."

Други уебсайтове използваха чатботове с изкуствен интелект, за да ремиксират публикувани истории от други издания, като едва избягваха плагиатството чрез добавяне на връзки към източника в долната част на материалите. Един сайт, наречен Biz Breaking News, използваше инструментите, за да обобщи статии от The Financial Times и Fortune, като допълваше всяка статия с "три ключови точки", генерирани от инструментите на ИИ.

Въпреки че много от сайтовете не изглеждаха да привличат посетители и при малко от тях се наблюдаваше значима ангажираност в социалните медии, имаше други признаци, че те са в състояние да генерират някакви приходи. Три пети от сайтовете, идентифицирани от NewsGuard, са използвали програмни рекламни услуги от компании като MGID и Criteo, за да генерират приходи, според прегледа на изследването на групата, направен от Bloomberg. MGID и Criteo не са отговорили веднага на запитванията за коментар.

Две дузини сайтове са били монетизирани с помощта на рекламната технология на Google, в чиито политики се посочва, че компанията забранява рекламите на Google да се появяват на страници със "съдържание с ниска стойност" и на страници с "репликирано съдържание", независимо от начина на генерирането му. (Google премахна рекламите от някои уебсайтове едва след като Bloomberg се свърза с компанията.)

Джансиракуза, професор от Бентли, заяви, че е обезпокоително колко евтина е станала тази схема, без да има човешка цена за извършителите на измамата. "Преди това беше нископлатена схема. Но поне не беше безплатна", казва той. "Сега е безплатно да си купиш лотариен билет за тази игра".