Какво представлява китайският DeepSeek и защо стресна света на AI

DeepSeek е китайски стартъп основан преди малко повече от година, чиито чатбот може да доведе до мащабни промени в сферата на изкуствения интелект

27 January 2025 | 20:00

Автор: Сарита Рай и Нюли Пърнел
Редактор: Антон Груев

Снимка: Bloomberg LP

DeepSeek, китайски стартъп за изкуствен интелект създаден преди малко повече от година, предизвика възхищение и недоумение в Силициевата долина, след като демонстрира революционни модели на изкуствен интелект, които предлагат производителност, сравнима с най-добрия чатбот в света и то поне привидно за частица от цената.

Появата на DeepSeek може да е контрапункт на широко разпространеното мнение, че бъдещото развитие на изкуствения интелект ще изисква все по-големи количества мощност и енергия.

В края на януари световните технологични акции се сринаха, тъй като шумът около иновацията на DeepSeek се разрасна и инвеститорите започнаха да разбират последиците за конкурентите му от САЩ и техните доставчици на хардуер.

Какво точно представлява DeepSeek?
DeepSeek е основана през 2023 г. от Лиан Уенфън, шеф на управлявания от изкуствен интелект хедж фонд High-Flyer. Компанията разработва модели с изкуствен интелект с отворен код, което означава, че широката общност от разработчици може да проверява и подобрява софтуера. Мобилното ѝ приложение се изкачи до върха на класацията за изтегляне на iPhone в САЩ след пускането му в началото на януари.

Приложението се отличава от други чатботове, като ChatGPT на OpenAI, с това, че излага своите аргументи, преди да даде отговор на запитване. Компанията твърди, че нейната версия R1 предлага производителност, равна на най-новата на OpenAI, и е предоставила лиценз на лица, които се интересуват от разработване на чатботове, които да използват технологията, за да я развиват.

Как се представя DeepSeek R1 в сравнение с OpenAI или Meta AI?
Въпреки че компанията не е представила подробна информация, разходите за обучение и разработване на моделите на DeepSeek изглежда са само малка част от тези, необходими за най-добрите продукти на OpenAI или Meta Platforms Inc. Много по-добрата ефективност на модела поставя под въпрос необходимостта от огромни капиталови разходи за придобиване на най-новите и най-мощни ускорители на AI от компании като Nvidia Corp. Това също така засилва вниманието към ограниченията на САЩ върху износа на такива усъвършенствани полупроводници за Китай - които имаха за цел да предотвратят пробив от рода на този, който изглежда представлява DeepSeek.

Още по темата

С програмата Stargate САЩ искат да запазят лидерството си областта на AI

Трудностите направиха DeepSeek изобретателни

DeepSeek твърди, че R1 е близо до или по-добър от конкурентните модели в няколко водещи бенчмаркове, като AIME 2024 за математически задачи, MMLU за общи познания и AlpacaEval 2.0 за работа с въпроси и отговори. Той се нарежда и сред най-добре представилите се в класация, свързана с Калифорнийския университет в Бъркли, наречена Chatbot Arena.

Какво предизвиква тревога в САЩ?
Вашингтон забрани износа на високотехнологични продукти като чипове за графични процесори за Китай, за да спре напредъка на страната в областта на изкуствения интелект - ключов фактор в съревнованието между САЩ и Китай за технологично надмощие.

Напредъкът на DeepSeek обаче показва, че китайските инженери по изкуствен интелект са заобиколили ограниченията, като са се съсредоточили върху по-високата ефективност на ограничените ресурси. Макар да не е ясно до какъв усъвършенстван хардуер за обучение на ИИ е имала достъп DeepSeek, компанията е демонстрирала достатъчно, за да се предполага, че търговските ограничения не са успели изцяло да ограничат напредъка на Китай.

Кога DeepSeek предизвика глобален интерес?
Разработчикът на изкуствен интелект е наблюдаван отблизо още от пускането на най-ранния му модел през 2023 г. След това през ноември той даде на света представа за своя модел за разсъждение DeepSeek R1, предназначен да имитира човешкото мислене. Този модел е в основата на мобилното му приложение за чатботове, което заедно с уеб интерфейса през януари придоби световна известност като много по-евтина алтернатива на OpenAI, а инвеститорът Марк Андресен го нарече „моментът Спутник на ИИ“.

Мобилното приложение DeepSeek е изтеглено 1,6 млн. пъти до 25 януари и е на първо място в магазините за приложения за iPhone в Австралия, Канада, Китай, Сингапур, САЩ и Обединеното кралство, според данни на компанията за проследяване на пазара App Figures.

Кой е основателят на DeepSeek?
Уенфън е роден в Гуандун през 1985 г. и получава бакалавърска и магистърска степен по електронно и информационно инженерство от университета в Джъдзян. Основава DeepSeek с регистриран капитал от 10 млн. юана (1,4 млн. долара), според базата данни на компанията Tianyancha.
Лиан заяви в интервю за китайското издание 36kr, че пречката за по-нататъшния напредък не е в набирането на повече средства, а в ограниченията на САЩ за достъп до най-добрите чипове.

Повечето от най-добрите изследователи наскоро са се дипломирали от най-добрите китайски университети, каза той и подчерта, че е необходимо Китай да разработи своя собствена вътрешна екосистема, подобна на тази, изградена около Nvidia и нейните чипове за изкуствен интелект.

„Повече инвестиции не водят непременно до повече иновации. В противен случай големите компании ще завладеят всички иновации“, казва Лиан.

Къде е мястото на DeepSeek в китайския пейзаж на изкуствения интелект?
Китайските технологични лидери, от Alibaba Group Holding Ltd. и Baidu Inc. до Tencent Holdings Ltd., са вложили значителни средства и ресурси в надпреварата за придобиване на хардуер и клиенти за своите предприятия в областта на ИИ. Наред със стартъпа 01.AI на Кай-Фу Лий, DeepSeek се отличава със своя подход с отворен код - предназначен за бързо набиране на най-голям брой потребители, преди да се разработят стратегии за монетизиране на тази голяма аудитория.

Тъй като моделите на DeepSeek са по-достъпни, те вече изиграха роля в намаляването на разходите на разработчиците на изкуствен интелект в Китай, където по-големите играчи водят ценова война, която доведе до последователни вълни на намаляване на цените през последната година и половина.
Какви са последиците за световния пазар на изкуствен интелект?

Успехът на DeepSeek може да накара OpenAI и други доставчици от САЩ да намалят цените си, за да запазят установената си водеща позиция. Той също така поставя под въпрос огромните разходи на компании като Meta и Microsoft Corp. - всяка от които е поела ангажимент за капиталови разходи в размер на 65 млрд. долара или повече през тази година, основно за инфраструктура за изкуствен интелект - ако по-ефективни модели могат да се конкурират с много по-малки разходи.

Това разтърси световните фондови пазари, тъй като инвеститорите разпродадоха компании като Nvidia Corp. и ASML Holding NV, които се възползваха от бурното търсене на услуги за изкуствен интелект. Акциите на китайски компании се забавиха.

Акциите на китайски компании, свързани с DeepSeek, като Iflytek Co., поскъпнаха. Разработчици от цял свят вече експериментират със софтуера на DeepSeek и искат да създадат инструменти с него. Това може да ускори приемането на усъвършенствани модели за разсъждение с изкуствен интелект, като същевременно може да предизвика допълнителна загриженост относно необходимостта от предпазни мерки при използването им. Напредъкът на DeepSeek може да ускори регулирането на начина, по който се развива ИИ.

Какви са недостатъците на DeepSeek?
Подобно на всички други китайски модели на изкуствен интелект, DeepSeek си налага автоцензура по теми, считани за чувствителни в Китай. Той отклонява запитвания за протестите на площад Тянанмън през 1989 г. или за геополитически въпроси като възможността Китай да нахлуе в Тайван. По време на тестовете ботът DeepSeek е способен да дава подробни отговори за политически фигури като индийския министър-председател Нарендра Моди, но отказва да направи това за китайския президент Си Дзинпин.

Облачната инфраструктура на DeepSeek вероятно ще бъде подложена на изпитание от внезапно набраната популярност. Компанията преживя кратко, но мащабно прекъсване на 27 януари и ще трябва да се справи с още по-голям трафик, тъй като нови и завръщащи се потребители отправят повече запитвания към чатбота.