Бизнес старт

Всеки делник от 7:30 часа
Водещи: Роселина Петкова и Христо Николов

BgGPT и езиковите модели - как държавата, бизнесът и учениците да използват умно AI

Антон Александров, INSAIT - Институт за компютърни науки, изкуствен интелект и технологии, "Бизнес старт", 06.03.2024 г.

11:31 | 6 март 2024
Обновен: 14:17 | 6 март 2024
Автор: Даниел Николов

Държавните институции може да извлекат големи ползи от BgGPT на INSAIT със сравнително малко допълнителни ресурси, като например да спестят много време при генерирането на шаблонен текст на ръка. Учениците могат да го използват да им напише домашните, но могат и да използват генерираните отговори, за да обогатят собствените си анализи, така че да развият собствено критично мислене. Това коментира Антон Александров, INSAIT, в предаването "Бизнес старт" с водещ Христо Николов.

"Изкуственият интелект би помогнал на учениците, когато имат да напишат есе -  не да им напише самото есе, което после да предадат, защото на всичко отгоре е абсолютно очевидно, че е написано от генеративен модел, а да им даде пример или идеи как могат да представят тази теза или как да се аргументират по-добре."

BgGPT е със свободен достъп и всеки бизнес може да настрои модела към конкретна задача като създаване на примерни текстове и шаблони, попълването им с данни, каза Александров. Моделът може да пише и софтуерен код след инструкции на български език, и ако интерес може да бъде развита специална версия за създаване на софтуер.

Всеки един голям езиков модел (LLM), каквото са генеративните AI и BgGPT, започва с данните, върху които се обучава - моделът не може да надмине възможностите на самите данни. Обучението работи на базата на статистика и алгоритми, които позволяват да се прави връзка между думите в текста и възпроизвеждането им. Когато зададем въпрос на генеративен AI, ние изместваме статистиката на модела в някоя посока и така някои думи стават по-вероятни от други, обясни Александров.

Създаването на голям езиков модел на български е изисквало създаването на нови техники като адаптиране към кирилица. Голямо предизвикателство е, че няма много данни на български език.

"Ние тръгваме от модел, който разбира английски, и използвайки неговите вътрешни статистики и способности, може с по-малко данни да го обучим на български."

Целия разговор може да гледате във видеото.

Всички гости на предаването "Бизнес старт" може да намерите тук.