AI революция? DeepSeek нито е евтин, нито е отворен, нито е сигурен модел
Васил Величков, съосновател и главен технологичен директор на Sensika, "Бизнес старт", 05.02.2025 г.
Обновен: 09:24 | 7 февруари 2025
Отвореният голям езиков модел на китайския стартъп DeepSeek не е нито особено по-евтин за използване, нито по-добър от конкурентните предложения на OpenAI или Meta. Въпреки това, Китай не трябва да бъде подценяван като източник на значими технологични пробиви. Създалата се първоначална медийна мания все пак доведе до загуба за около 2 трилиона долара за технологичните акции в САЩ. Това коментира Васил Величков, съосновател и главен технологичен директор на Sensika, в предаването "Бизнес старт" с водещ Христо Николов.
Моделът на DeepSeek наподобява този на ОpenAI в това, че може да симулира "мисли" (т.нар. reasoning AI), но и други компании като Google и европейската Mistral предлагат такива напреднали модели, каза Величков
"Новото е, че DeepSeek отвориха тегловите коефициенти - но не кода, не данните с които обучиха модела - което позволява хората да си свалят този модел и да го доубочават или да го специализират... Доколко е революционен този модел - ами не е революционен. Той стъпва върху разработки на няколко водещи американски и европейски компании и институти; на практика обаче, вкарва някакви иновации, които свалят цената за трениране и използването му."
Въпреки това промяната в цените не е толкова голяма, колкото беше очаквано първоначално с обявените 27 пъти по-малко средства, отколкото за ChatGPT. Това продължи няколко дни, след което достъпът до DeepSeek беше ограничен - компанията заяви, че е подложена на атака, но "те просто нямат ресурси, за да обслужат толкова потребители."
"Никой не е успял да възпроизведе тази себестойност, която те твърдят, че имат; много компании предлагат този модел, но върху собствен хардуер, и нито една от тях не може да докара дори приблизително цената, на която го пусна DeepSeek", каза Величков и добави, че тази цена вероятно е субсидирана от хедж фондът, който стои зад китайския стартъп.
Твърденията, че обучението на модела е струвало само 6 млн. долара не може да бъде истина, и се отнася за предшестващия базов, а не напреднал модел на компанията.
"Получава се малко като вица от соц време - "Работническо дело" излиза на първа страница "Изнасяме компютри за Япония"; на следващия ден излиза малка бележка не били компютри, а били компоти, и не сме ги изнесли, а са ни ги върнали, защото са развалени."
Но всички медии съобщиха новината за евтиния китайски модел и това подплаши дребните инвеститори, което изтри 2 трилиона от пазарната капитализация на борсите в САЩ, каза Величков.
Цената на Nvidia още не се е възстановила на нивата отпреди новината за DeepSeek, но е на нивото, на което трябва да бъде предвид очакванията за продажбите. Nvidia няма проблеми с търсенето на нейните най-модерни GPU ускорители за изкуствен интелект, а с мащаба на производство, тъй като само тайванската TSMC може да произведе чиповете, използвайки само литографски машини от холандската ASML. Това значително ограничава колко GPU за изкуствен интелект може да пусне Nvidia на пазара, но за момента може да е спокойна, защото няма близък конкурент, обясни Величков.
За да бъде инсталиран и да работи моделът на DeepSeek с нормална производителност за един потребител са нужни осем от най-новите GPU чипове на Nvidia, в конфигурация за минимум 250 000 долара, при това с "огромна отстъпка", каза Величков. 20% от продажбите на Nvidia в момента се случват в Сингапур, където няма нито един център за данни, така че тези продажби отиват в Китай, добави той.
"Фактът, че услугата беше достъпна пет дни и я спряха поради липса на капацитет, показва ясно, че обучението на модели е скъпо, но ако трябва да обслужваш милиони потребители, ти трябват няколко порядъка повече хардуер."
Моделът на DeepSeek се спрява добре на определени езици и в определени сфери, показват тестовете на Sensika. Но в никакъв начин не трябва да подценяваме Китай, каза Величков. Страната гради върху придобитата интелектуална собственост и залага много и на образованието на собствени експерти. В същото време китайските технологични и AI гиганти са дълбоко обвързани с държавата и техните модели не покриват западните условия за сигурност на данните, предупреди Величков.
"Дори 1% от потребителите, които са пробвали модела, да са качили чувствителни документи, които не са публично достъпни - само събирането на тези документи е достатъчна причина те да субсидират цената на модела за използването им."
Какво промени DeepSeek в сектора на изкуствения интелект може да гледате във видеото.
Всички гости на предаването "Бизнес старт" може да намерите тук.