OpenAI пуска два „отворени“ AI модела след успеха на DeepSeek

Малко след като DeepSeek пусна своя отворен R1 през януари, главният изпълнителен директор Сам Алтман заяви, че OpenAI обмисля да публикува част от „тежестите“ на свои модели.

6 August 2025 | 12:45
Автор: Рейчъл Метц
Редактор: Емил Соколов
Снимка: Bloomberg.com
Снимка: Bloomberg.com

OpenAI представя двойка свободно достъпни модели за изкуствен интелект, способни да имитират човешкото мислене, няколко месеца след като китайската DeepSeek привлече световно внимание със своя собствен отворен AI софтуер.

Двата модела — GPT-oss-120b и GPT-oss-20b — ще се предлагат в платформата Hugging Face и могат да генерират текст (но не изображения или видео) в отговор на потребителски заявки, съобщи OpenAI във вторник. Компанията допълни, че моделите могат да изпълняват и сложни задачи като писане на програмен код и търсене на информация онлайн от името на потребителя.

Ключово е, че двата модела са „open-weight“ системи, подобно на Llama на Meta Platforms Inc. „Тежести“ (weights) се наричат параметрите в AI модела. OpenAI разкрива числовите стойности, които моделите са придобили и коригирали по време на обучението, което позволява на разработчиците по-лесно да ги персонализират. Компанията обаче не разкрива данните, използвани за обучението им, поради което моделите не покриват дефиницията за напълно open-source AI.

Въпреки името си, повечето модели на OpenAI са затворени системи — софтуер, контролиран от разработчика, недостъпен за промени от потребителите и с ограничена прозрачност относно вътрешната си архитектура. Както много американски конкуренти, OpenAI пази обучителните си данни и се стреми да таксува по-скъпо за най-мощните си модели, за да покрие огромните разходи по разработката. Последният „отворен“ модел на OpenAI беше GPT-2 от 2019 г., предшественик на софтуера зад оригиналния ChatGPT.

Малко след като DeepSeek пусна своя отворен R1 през януари, главният изпълнителен директор Сам Алтман заяви, че OpenAI обмисля да публикува част от „тежестите“ на свои модели и че трябва да „измисли различна open-source стратегия“. По-скоро планът за изкуствен интелект на президента Доналд Тръмп насърчи разработването на отворени модели, изтъквайки потенциала им да „станат глобален стандарт“ за бизнеса и академичните изследвания.

Критиците на отворения код отдавна твърдят, че той е по-несигурен. През юли Алтман написа в X (Twitter), че OpenAI е планирала да пусне open-weight модел в средата на месеца, но отлага, „за да проведе допълнителни тестове за безопасност и да прегледа области с висок риск“.

„Доверяваме се, че общността ще създава страхотни неща с този модел, но щом веднъж тежестите излязат, те не могат да бъдат върнати“, посочи той. „Това е нещо ново за нас и искаме да го направим както трябва.“

OpenAI възнамерява новите модели да се използват от физически лица, компании и правителства, които искат да настройват и пускат AI системи на собствен хардуер и услуги. Сред тестовите партньори са френският оператор Orange SA и софтуерната фирма Snowflake Inc.

Моделите ще се разпространяват и чрез Bedrock — репозитория за модели на Amazon.com Inc., както и през облака на Groq и саудитската Humain AI. И двата са сравнително компактни и ефективни: по-мощният 120b може да работи на един графичен процесор (GPU) с 80 GB памет, а 20b се справя дори на лаптоп с 16 GB RAM, твърди OpenAI.

По време на брифинг за журналисти тази седмица компанията заяви, че очаква обратна връзка от потребителите, която ще ѝ помогне да прецени какъв тип „отворен“ модел да пусне в бъдеще.