Китай трудно ще навакса изоставането си от ChatGPT въпреки огромните инвестиции

Baidu и Alibaba рекламират иновации, но са в неравностойно положение поради липса на подходящи данни и изчислителна мощност

19:00 | 21 февруари 2023
Обновен: 19:24 | 21 февруари 2023
Автор: Антон Груев
Снимка: Bloomberg L.P.
Снимка: Bloomberg L.P.

Китайските технологични гиганти, сред които Baidu, Alibaba и NetEase, се надпреварват да се изравнят с последните постижения на Запада в областта на изкуствения интелект, като рекламират проекти, с които се надяват да постигнат същия успех като с пускането на ChatGPT, пише в свой материал Financial Times.

След като месеци наред обявяваха съкращения на разходите и броя на служителите, сега големите групи оптимистично представят инвестиционни планове, които да се конкурират с чатбота на OpenAI.

Джоу Хонги, ръководител на компанията за интернет сигурност Qihoo 360, определи ChatGPT - програма, която създава реалистични текстови отговори на въпроси, задавани от хора - като началото на революцията в областта на изкуствения интелект. "Тя има недостатъци, но и неограничен потенциал", каза той по време на дискусия в токшоу миналата седмица.

Надпреварата за достигане на ChatGPT идва в момент, в който китайските технологични групи прекараха по-голямата част от последните две години в отбрана срещу агресивните мерки на регулаторните органи и в борба за растеж в условията на предизвикано от Covid забавяне.

Baidu предприема най-конкретните ранни стъпки, като планира да пусне чатбот на име Ernie в своята търсачка през следващите няколко месеца, подобно на Bing Chat на Microsoft и OpenAI.

Моделът на изкуствения интелект, който е в основата на бота, се разработва от 2019 г. насам, като най-новото му поколение е обучено на 260 млрд. параметри - сравнимо с GPT3, технологията в основата на ChatGPT, по отношение на размера, въпреки че е обучено на много по-малък набор от данни.

Според близък до компанията човек тази седмица Baidu планира да разкрие нови подробности за това как чатботът ще бъде интегриран в нейните продукти, включително в търсенето, електрическите превозни средства и интелигентните асистенти.

"Baidu е фокусирала таланта и парите си върху това, така че е най-вероятно да изгради една от водещите китайски платформи за GPT", казва Борис Ван, анализатор в Bernstein, който следи усилията на Китай в областта на AI. "Много зависи от тяхната премиера".

Новината за потенциалното пускане на бота Ernie от март доведе до поскъпване в акциите на Baidu с повече от 15%, докато Alibaba и NetEase бяха подкрепени от развитието на техните изследвания в областта на генеративния изкуствен интелект.

Акциите на по-малки групи за изкуствен интелект като Hanwang Technology и CloudWalk Technology са удвоили цената си от началото на годината. Този месец държавните медии предупредиха за спекулативната лудост.

Според доставчика на данни Tianyancha, от декември насам повече от дузина компании са се втурнали да регистрират търговска марка "ChatGPT" или други думи, съдържащи "GPT", за да ги използват в различни области - от научни инструменти до дрехи и реклами.

Този месец градската управа на Пекин заяви, че ще подкрепи компаниите, които създават свои собствени модели, които да съответстват на ChatGPT, а най-добрият университет на Шанхай Fudan събра повече от дузина ръководители на компании за изкуствен интелект и учени, за да анализират развитието на ChatGPT, рисковете за сигурността и потенциалните му употреби.

Анализатори и експерти обаче твърдят, че фанфарите и скокът на цените на акциите около всяко ново изявление не отразяват колко трудно ще бъде за китайските групи бързо да възпроизведат софтуера, създаден от компании като OpenAI и Google.

"Сега всеки иска да създаде ChatGPT, но това е много трудно, особено за китайските компании, които не могат да се сдобият с най-новите чипове на Nvidia и разполагат с ограничени набори от данни за обучение на модели на AI", казва Хуан Ли, създател на WeChaty, една от най-популярните програми за чатботове в Китай.

"За обучението на един модел са необходими много пари и ако една част не е подходяща, той няма да работи", каза той.

Макар че Китай е известен с изобилието си от данни за обучение на алгоритми, усилията са съсредоточени главно върху задачи за наблюдение, като разпознаване и откриване на обекти, действия или лица, според преглед на китайските документи за AI в доклада за състоянието на AI през 2022 г., публикуван от инвеститори в сектора.

Baidu се затрудни с предишния си опит за чатбот, известен като Plato, който според анализаторите не е могъл да отговори дори на прост въпрос като например: "Кога е рожденият ден на съоснователя на Alibaba Джак Ма?"

Анализаторите посочват, че липсата на висококачествен текст на китайски език в интернет и в други масиви от данни е пречка за обучението на софтуер за изкуствен интелект.

GPT, програмата, която стои в основата на ChatGPT, използва стотици хиляди английски академични статии, новинарски статии, книги и публикации в социалните мрежи, за да научи моделите, които формират езика. В същото време Ernie на Baidu е обучен предимно на данни на китайски език, както и на данни на английски език от Wikipedia и Reddit.

Изчислителните разходи за обучение и работа с големи езикови модели също са много високи. Според изчисленията разходите за функционирането на ChatGPT, при очаквания за 10 млн. потребители месечно, възлизат на 1 млн. долара на ден. Ръководител на водеща китайска компания за изкуствен интелект, който помоли да не бъде назоваван, отбеляза, че тя планира да съсредоточи усилията си върху специфични индустриални вертикали, като например обслужване на клиенти, вместо да залага на по-широк чатбот за разговори.

Забраната на Вашингтон за износ на съвременни полупроводници вероятно ще усложни проблема с изграждането на достатъчно изчислителна мощност за програмите за AI. Новите правила на САЩ не позволяват внасa в Китай на процесори като A100 на Nvidia, което прави обучението на моделите за изкуствен интелект по-скъпо и по-продължително.

Анализаторите на Bernstein смятат, че китайските групи вероятно са се запасили с достатъчно чипове, от които се нуждаят в краткосрочен план, но отбелязват, че таванът на Вашингтон за скоростта на процесорите, разрешени за износ в страната, означава, че китайските компании за AI ще изостанат с развитието на хардуера.

"За китайските компании ще бъде трудно да бъдат конкурентоспособни в световен мащаб", казва Ван от Bernstein.

"Толкова много компании сега правят съобщения за конкуренти на ChatGPT, но това не означава, че имат продукт", каза той. "Трудно е да се прецени, докато не можем да ги изпробваме."