"ChatXiPT" въплъщава философията на Си в нов китайски чатбот с AI

Интернет регулаторът използва политическата философия на китайския лидер, за да отговори на въпросите, зададени на последния голям езиков модел

17:21 | 23 май 2024
Автор: Bloomberg TV Bulgaria
Снимка: Bloomberg LP
Снимка: Bloomberg LP

Най-новият опит на Пекин да контролира начина, по който изкуственият интелект (ИИ) информира китайските интернет потребители, беше представен като чатбот, обучен на мислите и идеите на президента Си Дзинпин.

Най-новият голям езиков модел (LLM) на страната се учи от политическата философия на своя лидер, известна като "Мисълта на Си Дзинпин за социализма с китайски характеристики за новата ера", както и от друга официална литература, предоставена от Администрацията на киберпространството на Китай, пише в свой материал Financial Times.

"Експертизата и авторитетът на корпуса гарантират професионализма на генерираното съдържание", се казва в публикация в социалните медии в понеделник, посветена на новия LLM.

Усилията на властите да гарантират, че изкуственият интелект разбира философията на Си, идват в момент, когато китайските официални лица се ориентират към балансиране между драконовския контрол върху свободата на словото в страната и насърчаването на развитието на ИИ и създаването на конкуренти на такива като ChatGPT на Open AI.

Засега новият модел се използва в изследователски център под ръководството на влиятелния интернет регулатор, но според лице, участващо в проекта, в крайна сметка може да бъде пуснат за по-широка употреба. Новият модел може да отговаря на въпроси, да създава доклади, да обобщава информация и да превежда между китайски и английски език, се казва в публикацията. Създаването на LLM следва мащабните усилия на китайските официални лица да разпространяват идеите на Си за политиката, икономиката и културата в различни формати.

От името на Си са публикувани повече от дузина книги, а неговите бестселъри обикновено заемат централно място на панаирите на книгата в страната. Популярни новинарски приложения на компании като Tencent или NetEase запазват места в горната част на потребителските канали за статии от официални медии, в повечето случаи с участието на Си.

Официалните власти също така изискват от децата на 10-годишна възраст да изучават неговата политическа философия. Те създадоха приложението Study Xi Strong Nation, за да обучават и изпитват знанията на около 100 млн. партийни членове в страната. През 2018 г. идеите му бяха вписани в държавната конституция.

Издателството на Администрацията на киберпространството на Китай, която издаване правилата за генеративния ИИ и въведе лицензионен режим, който задължава доставчиците на генеративен ИИ "да въплъщават основните социалистически ценности" и казва, че генерираното съдържание не може да "съдържа съдържание, което подкопава държавната власт". Дружествата носят отговорност за своите резултати от ИИ. Това е особено предизвикателство за разработчиците на модели поради сравнително оскъдните набори от данни на китайски език, които са на разположение за обучение на техните големи езикови модели.

Повечето групи се обучават и върху информация на английски език, което въвежда потенциал генеративният изкуствен интелект да създава отговори, които са в разрез с речевите норми на Китай.

Технологични гиганти като Baidu и Alibaba са гарантирали, че техните модели стриктно контролират генерираното съдържание, свързано със Си или други потенциално чувствителни въпроси. Чатботовете с генеративен изкуствен интелект и на двете групи обикновено молят потребителите да рестартират чата, когато потребителите настояват за отговори по чувствителни теми.


 

 

 

 

 

За да помогне на разработчиците да се справят с този проблем, Китайската асоциация за киберсигурност, организация с нестопанска цел, която е свързана с CAC, пусна през декември първата публична база данни от 100 млн. записи на "висококачествени и надеждни данни", които групите могат да използват за обучение на модели. Според откъсите, прегледани от Financial Times, обучителният набор се основава в голяма степен на правителствени разпоредби и политически документи, доклади на държавните медии и други официални публикации.


Един от десетките текстови документи в пакета данни съдържа 86 314 споменавания на Си Дзинпин. "Нека се обединим по-тясно около Централния комитет на партията с другаря Си Дзинпин в основата му", гласи един ред. Трябва да "гарантираме, че в мисленето, политиката и действията си винаги неотлъчно следваме Централния комитет на партията с генерален секретар Си Дзинпин в основата му", пък гласи друг.