Как DeepSeek и моделите с отворен код разтърсват AI индустрията

Много технологични компании рекламират своите AI решения като отворени; не всички обаче са съгласни, че те наистина изпълняват това определение.

7 August 2025 | 18:41

Автор: Рейчъл Метц и Сет Фигерман
Редактор: Емил Соколов

Снимка: Bloomberg.com

Технологични компании и академични среди отдавна се борят с рисковете и ползите от създаването на софтуер с отворен код. Но манията около генеративния изкуствен интелект придаде ново значение на този дебат.

DeepSeek и други китайски компании пуснаха вълна от евтини, отворени модели, които съперничат на софтуера на водещите американски разработчици на AI. В отговор OpenAI — водеща американска AI компания — представи нов отворен модел, първия си от шест години насам. Администрацията на Тръмп призова още американски технологични фирми да направят същото.

Ето какво трябва да знаете.

Какво е отворен код?

В общия случай „отворен код“ означава софтуер, чийто изходен код е свободно достъпен за всеки, който иска да го използва или изменя. Според Open Source Initiative (OSI) — калифорнийска неправителствена организация, която защитава този начин на работа — за да бъде признат за отворен, софтуерът трябва да отговаря на конкретни условия за разпространение и достъп.

За един AI модел да се счита наистина за отворен, OSI посочва, че неговите разработчици трябва да предоставят подробна информация за данните, върху които е обучен, и да дадат възможност на хората да изучават, използват и модифицират системата за всякакви цели.

„Затворен код“, напротив, обозначава софтуер и модели, които се контролират от разработчика, не могат да бъдат изменяни и предоставят по-малко прозрачност относно техническите си основи.

Предлагат ли водещите разработчици на AI софтуер с отворен код?

Много технологични компании рекламират своите AI решения като отворени; не всички обаче са съгласни, че те наистина изпълняват това определение.
Meta Platforms Inc., френският стартъп Mistral и сега DeepSeek пуснаха модели, които наричат „отворени“.

Често обаче тези модели фактически са т.нар. „open-weight“ модели. Това означава, че освен самия модел и евентуално част от изходния код, компаниите разкриват тежестите — многото числови стойности, които моделът е усвоил и върху които е бил настройван по време на обучението си, позволяващи на разработчиците да го персонализират — но не и подробности за данните, използвани за обучението.

Meta, например, предлага тежестите и част от кода за серията си модели Llama, но не предоставя детайлна информация за обучаващите данни. OSI също така по-рано критикува Meta за лицензионни условия, включващи определени ограничения за търговска употреба.

По сходен начин, през януари DeepSeek обяви, че пуска най-новата си система R1 като модел с отворен код, но не предостави нито код, нито обучаващи данни. Това породи въпроси какво точно компанията е използвала, за да изгради модела си.
OpenAI, въпреки „open“ в името си, не отваря повечето от моделите си. Но скоро след вирусния успех на DeepSeek, главният изпълнителен директор на OpenAI Сам Алтман призна, че създателят на ChatGPT трябва да „измисли различна стратегия за отворен код“. Той добави: „Лично аз смятам, че досега бяхме на грешната страна на историята.“

През август OpenAI пусна два модела — GPT-oss-120b и GPT-oss-20b — които са open-weight системи, подобни на Llama. Моделите са свободно достъпни в платформата за хостване на AI софтуер Hugging Face. Те могат да имитират човешко разсъждение и да генерират текст — но не и изображения или видео — в отговор на потребителски подканвания.

Какви са ползите от отворения код?

Поддръжниците на софтуера с отворен код обикновено изтъкват, че той е по-достъпен ценово за потребителите, тъй като няма същите лицензионни такси. По-ниските цени разширяват възможностите за приемане на AI, а намалените разходи за разработка насърчават иновациите. Привържениците също така отбелязват, че този подход повишава отчетността на разработчиците, които създават мощни AI системи, като дава на други възможността да разберат по-добре как работят моделите.

Затворените системи крият риска да създадат пазар на AI, доминиран от шепа могъщи компании. Изпълнителният директор на компанията за облачно съхранение Box Inc. Арън Леви каза: „В света на много скъпия и собственически AI доставчиците на AI биха могли — и вероятно би трябвало — да запазят цялата икономика за себе си, изстисквайки възможностите за разработчиците и екосистемата.“

За компании като Meta има и допълнителна полза от отворения код: популярността. Като позволява на други разработчици свободно да имат достъп до нейния софтуер с отворен код и да надграждат върху него, Meta успя да разшири влиянието си в цялата AI екосистема.

Какви са рисковете на отворените системи?

Критиците на софтуера с отворен код твърдят, че той е по-несигурен. В случая с AI някои в САЩ се опасяват, че използването на подобни модели от съперници като Китай представлява риск за националната сигурност и застрашава безопасността на гражданите. Например модели, които събират огромни количества потребителски данни, биха могли да се използват за наблюдение. Освен това се изразяват опасения, че американски компании, които предлагат своите AI модели с различна степен на откритост, могат потенциално да дадат на съпернически държави възможност да ги използват, за да задминат технологично САЩ.

Защо DeepSeek избра „отворения“ път?

Като възприе по-отворен подход (с някои уговорки), DeepSeek вероятно е намалила опасенията на глобалните потребители относно строгия контрол на Китай върху технологията. Стартъпът вероятно е разширил и обхвата на своя чатбот на западните пазари, като е улеснил други разработчици да адаптират базовата технология към собствените си нужди.

С други думи, DeepSeek на практика следва същата стратегия, която Meta използва, за да завземе по-голяма част от AI екосистемата — факт, който явно не е убягнал на главния изпълнителен директор на Meta Марк Зукърбърг.

„Това е огромно геополитическо съперничество и Китай се хвърля в него изключително агресивно“, каза Зукърбърг в интервю за подкаста The Joe Rogan Experience. „Ако трябва да има модел с отворен код, който всички да използват, бихме искали той да е американски.“

Как работи AI моделът на DeepSeek?

Подобно на някои от най-новите модели на водещи американски разработчици — включително OpenAI и Google — R1 на DeepSeek е предназначен да имитира начина, по който хората понякога размишляват над проблем, като отделя време за изчисляване на отговор, преди да отговори на потребителски запитвания. Версията на DeepSeek, изградена върху един от другите наскоро пуснати модели на компанията — V3, се различава от американските си конкуренти по своята ефективност.

Екипът зад нея е работил новаторски. Докато съперниците са използвали огромен брой мощни чипове, за да изградят подобни AI модели, членовете на екипа на DeepSeek очевидно са намерили начини да използват ефективно относително малкото по-стари чипове, до които са имали достъп заради американските експортни ограничения върху най-авангардните полупроводници. Освен това те силно са разчитали на техника, известна като обучение чрез подсилване (reinforcement learning), която възнаграждава системата за верни отговори и я наказва за грешни.

В САЩ някои технологични и политически лидери признаха тези постижения, но в същото време повдигнаха въпроси дали китайската компания не е изградила чатбота си на гърба на западни технологии, избягвайки част от огромните разходи за разработване на големи езикови модели — градивните елементи на чатботовете.

Какво казват държавните представители за отворения код?

След преглед през 2024 г. администрацията на тогавашния президент Джо Байдън стигна до извода, че е преждевременно да се налагат ограничения върху отворените AI модели, но остави открита възможността в бъдеще да се появят основания за такива мерки.

Администрацията на Доналд Тръмп изрази известна подкрепа за моделите с отворен код и „отворени тежести“, вероятно в отговор на опасенията относно възхода на китайския AI. В Плана за действия в областта на AI на Тръмп, публикуван през юли, Белият дом насърчава разработването на отворени модели, като посочва техния потенциал да „се превърнат в глобални стандарти“ за бизнеса и академичните изследвания. „Поради тази причина“, се казва в плана, „те имат и геостратегическа стойност.“