Google пуска нови TPU чипове и фонд от $750 млн. за ускорено внедряване на AI
Google Cloud стартира фонд от $750 млн. за консултантски компании, за да ускори внедряването на изкуствен интелект и агентни системи в бизнеса.
Редактор: Антон Груев
Подразделението Google Cloud на Alphabet Inc. представи най-новото поколение на своя процесор за тензорна обработка (TPU) – собствен разработен чип, създаден да направи изчисленията за изкуствен интелект по-бързи и по-ефективни.
Новата серия ще се предлага в две версии, съобщи компанията в сряда по време на събитието Google Cloud Next, където също така обяви фонд от $750 млн. за насърчаване на внедряването на изкуствен интелект в бизнеса и демонстрира инструменти за създаване на AI агенти. TPU 8t е предназначен за създаване на софтуер с изкуствен интелект, докато TPU 8i е проектиран да изпълнява AI услуги след тяхното създаване – етап, известен като инференция.
Акциите на Alphabet поскъпнаха с 1,7% преди началото на търговията в Ню Йорк.
Google се утвърди като един от най-успешните производители на собствени AI чипове в индустрия, доминирана от Nvidia Corp. През последните месеци TPU се превърнаха в силно търсен ресурс в Силициевата долина, а компанията се стреми да надгради този интерес с новото поколение.
Този ход е част от по-широка стратегия за намаляване на разходите и енергийната консумация при внедряването на AI софтуер. Компанията също така работи за подобряване на скоростта на реакция на услугите. Новите TPU съхраняват повече информация директно върху чипа, което позволява по-бързи отговори. В същото време изискванията към все по-сложните софтуерни системи продължават да нарастват.
„Става дума за това как да се осигури възможно най-ниска латентност на отговора при възможно най-ниска цена за всяка операция“, заяви Марк Ломайер, вицепрезидент по изчислителни и AI инфраструктури в Google. „Броят на операциите расте рязко и цената на всяка трябва да намалява, за да може системата да се мащабира.“
Създаването на AI софтуер се осъществява чрез системи, които обработват огромни обеми от данни, за да откриват зависимости и закономерности, които могат да бъдат описани математически. Инференцията – изпълнението на тези системи – се възползва от процесори с големи вградени обеми памет.
Този подход позволява по-бързи отговори, тъй като не се налага търсене на информация извън самия чип. Това е особено важно при системи, които „разсъждават“, преминавайки през множество стъпки и учейки се от собствените си действия.
Чипът за обучение TPU 8t може да бъде комбиниран в конфигурации до 9600 полупроводника. Google посочва, че при такива мащабни системи електроенергията се превръща в основно ограничение, което налага по-ефективни решения.
TPU 8t предлага 124% по-висока производителност на ват спрямо предходното поколение, а TPU 8i – подобрение от 117%. Това се дължи и на усъвършенствани вътрешни мрежи, които подобряват комуникацията между чиповете. Системите, базирани на новите TPU, ще бъдат широко достъпни по-късно през годината.
Компанията ще продължи да предлага услуги, базирани на чипове на Nvidia, за клиенти, които предпочитат тези решения. Google планира да бъде сред първите, които ще внедрят нов дизайн на Nvidia през втората половина на годината.
Подобно на Google, Nvidia също насочва усилията си към инференцията. Бъдещите ѝ продукти ще включват технологии от придобиването на Groq – компания, специализирана в изключително бързи AI изчисления.
Главният изпълнителен директор на Nvidia Дженсън Хуанг заяви, че над 20% от AI натоварванията могат да се обслужват най-ефективно от този тип чипове. Groq е основана през 2016 г. от бивши инженери на Google, а през декември Nvidia плати $20 млрд. за лиценз върху технологията и привлече по-голямата част от инженерния екип.
Отделно, Google представи набор от инструменти за създаване на AI агенти, които могат да проследяват дейността си в рамките на компаниите, включително чрез специална входяща кутия за отчети и напредък. Компанията също така обяви обновления в пакета Workspace и визия, при която AI агентите значително ще променят ежедневната работа.
Новият фонд от $750 млн. има за цел да подпомогне консултантски компании при внедряването на агентен изкуствен интелект.
Лабораторията DeepMind ще предостави ранен достъп до моделите Gemini, а инженерите на Google ще работят съвместно с партньорите за решаване на клиентски проблеми. Средствата ще бъдат разпределени в рамките на следващите 12 месеца и ще се използват за обучение, разработване на AI агенти и подпомагане на внедряването им в бизнеса.