Изкуственият интелект ще изследва езика, за да подобри вземането на решения

Екипът на Google за изкуствен интелект оттогава е издал код, който е в основата на няколко модерни модела, предварително обучени на все по-големи набори от данни

13:55 | 20 октомври 2021
Обновен: 14:17 | 20 октомври 2021
Автор: Михаил Митев
Снимка: Bloomberg LP
Снимка: Bloomberg LP

Изпълнителните директори и други мениджъри все повече се намират под лупа, тъй като някои инвеститори използват изкуствен интелект, за да изследват и анализират езикови модели и тонове, и така откриват новите възможности за грешки, пише Reuters.

В края на 2020 г., според специалист по софтуера за езикови модели Евън Шнидман, някои ръководители на ИТ индустрията намаляват вероятността за недостиг на полупроводникови чипове, докато обсъждат прекъсвания във веригата на доставки. Въпреки това, тонът на речта им показва висока степен на несигурност, според алгоритмичен анализ, разработен, за да разкрива скритите улики на произнесените думи.

"Установихме, че тонът на ръководителите на ИТ сектора не съответства на положителния смисъл на техните забележки", казва Шнидман, който съветва двете финтех компании зад анализа.

В рамките на месеци след коментарите компаниите, включително Volkswagen и Ford, предупредиха за сериозния недостиг на чипове, ударили производителността. Цените на акциите на автомобилните и индустриалните компании паднаха. Сега ИТ мениджърите казват, че има спад ​на доставките. 

Един пример обаче не може да бъде показателен за точността на анализа на речта, тъй като не знаем дали ръководителите са били прекалено оптимистични от самото начало или наистина са променили възгледите си, когато обстоятелствата се променят.

Някои инвеститори обмислят технология, позната като обработка на естествен език (NLP) като един от новите инструменти за получаване на предимства пред конкурентите си с новите езикови системи. Традиционните финансови данни и корпоративни отчети понастоящем се добиват толкова лесно и масово, че не представляват голяма стойност. 

NLP е клон на изкуствения интелект, където за машинното обучение се използва език, за да се осмисли и след това да се превърне в количествено измерими сигнали, които влияят върху размера на средствата в търговията. Най-амбициозният софтуер в тази област е насочена към анализ на чутите тонове, интонацията и акцентите на изречените думи заедно с фразеологията.  Други се стремят да анализират записи от изказвания и интервюта по все по-сложни начини.

Слави Маринов, ръководител на машинното обучение в Man AHL, част от компанията за управление на инвестиции в размер на 135 милиарда долара, казва пред Reuters, че NLP е "една от основните области на изследване" във фонда, управляван от компютри. "Тези модели трансформират нещо, което е много объркано, в нещо, което е лесно разбираемо", допълва още.

Наистина, поддръжниците казват, че NLP може да отключи неизползван потенциал за разбиране на света от "неструктурирани данни": разговорите с анализатори, неписаните въпроси и отговори, както и интервюта в медиите. Темата подлежи на обсъждане. Разработването и стартирането на тези системи за изкуствен интелект може да струва милиони долари, което изключва възможността много инвеститори и разработчици да спестят.

Някои също са в сравнително експериментален етап и без публично достъпни данни, които да показват, че печелят пари. Интервюираните фондове са отказали да предоставят доказателства, че NLP може да увеличи доходността, като се позовава на търговската чувствителност. Някой проучвания обаче показват, че тези техники могат да подобрят производителността, ако се съсредоточат върху интелигентни места.

Анализът, извършен през септември от квантовите стратези на Nomura, показа връзката между сложността на езика на ръководителите по време на разговори за приходи и акции. Американските шефове, които са използвали прост език, виждат, че акциите на техните компании са се увеличили с 6% годишно от 2014 г. насам, в сравнение с тези, които използват сложни формулировки. Анализаторите на BofA използват модел, който използва фрази в призивите за печалба, за да прогнозират лихвените проценти на корпоративните облигации. Изследват се хиляди фрази като "намаляване на разходите" и "изгаряне на пари", за да намери фрази, свързани с бъдещи неизпълнения. Повторното тестване на модела показа висока корелация с вероятностите за неизпълнение, съобщава BofA.

Култура на машинното измерване 

През последните години езиковата обработка във финансите включва основен и широко продаван софтуер, който класира новините или публикациите в социалните медий според настроенията.

Това губи стойност в лицето на все по-сложните модели на NLP, които са стимулирани от техническия напредък и намаляването на разходите за облачни изчисления. Пробивът идва през 2018 г., когато разработчиците са пуснаха изходния код на NLP за трансферно обучение, което позволи на модела да бъде предварително обучен върху набор от думи и след това да започне работа по друг, спестявайки време и пари.

Екипът на Google за изкуствен интелект оттогава е издал код, който е в основата на няколко модерни модела, предварително обучени на все по-големи набори от данни. Разработчиците на съвременни системи казват, че обработват десетки хиляди думи със светкавична скорост. Извличат модели и количествено определят степента на връзката им с определени смислени ключови думи, фрази и идеи, зададени от потребителя.

Маринов от MAN AHL вижда ползите в тоналния анализ, но все още не го е използвал, като засега се е фокусирал върху уликите, скрити в писмения текст.

Това може да бъде всичко - от сравняване на годишните отчети с течение на времето до намиране на фини промени, които не са очевидни за читателя, до количествено определяне на нещо толкова нематериално като корпоративната култура. В миналото някои инвеститори са се опитали официално измерване на корпоративната култура, въпреки че тя е от решаващо значение за дългосрочната ефективност, особено в областта на инвестициите в ESG, свързани с околната среда, социалните и управленски съображения. Моделът Man Ahl може да сканира коментарите на изпълнителните директори, за да намери думи или фрази, които показват "целенасочена" култура, както и да преглежда отзивите на служителите на сайта за кариера Glassdoor.

Кай Ву, основател на хедж фонда Sparkline Capital, създаде "профили на личността" за компаниите, за да измери ангажимента си към определени културни ценности. Той избира оригиналните думи, които смята, че отразяват такива ценности. След това неговият NLP модел свежда огромни количества думи до малък брой думи със сходни значения и резултатите се изразяват числено. Използвайки своя модел на NLP в коментарите на ръководството и отзивите на служителите, той установява, че компаниите с "особени" култури като Apple, Southwest Airlines и Costco са надминали конкурентите. Обратно, американските предприятия, демонстриращи "токсичност", където служителите използват специфични идиоми като "клуб на добрите стари момчета" и "куче, което яде куче", имат значително по-слабо представяне, казва Ву.

Без повече правила

Фондовете, които нямат ресурсите за наемане на специалисти за обработка на данни r за създаване на собствени инструменти на NLP, могат да се закупят анализатор от трети лица на фирми. Като тези, които консултира Шнидман, финтехът Aiera и доставчик на тонални анализатори Helios Life Enterprises, които продават своите услуги на клиенти като хедж фондове. Въпреки това, Ву от Sparkline смята, че фондовете трябва да получат данни, получени въз основа на NLP, "колкото е възможно по-близо до първоначалните данни", като за предпочитане е да се използват собствени модели.

Технологията е изправена пред други предизвикателства и правилното й използване може да отнеме много време. Нидерландският мениджър на NN Investment Partners използва комбинация от данни от трети страни и собствени модели, някои от които все още са в изследователската фаза.Работи се по проект, с обучаващ се модел за намиране на думи, които лихвените проценти по задълженията по облигациите, казва Себастиан Райндерс, ръководител на инвестиционната наука на NNIP. Това първоначално е изисквало портфейлните мениджъри да изследват дълги списъци с фрази, за да ги маркират ръчно като положителни или отрицателни. Повечето модели са ориентирани към английски език, а разработчиците могат да се справят с трудната задача да ги адаптират, за да четат точно настроенията на хора от различни култури, говорещи други езици.

Когато Джордж Мусали, главен инвестиционен директор в базираната в САЩ PanAgora Asset Management, казва на шефа на биотехнологична фирма, че изкуствен интелект на неговия фонд сканира коментарите ръководители за ключови думи, човекът е поискал списък, който да помогне на бизнеса си да се изкачи по-горе. Мусали отхвърли искането, но заяви, че документи като преписи от обаждания за приходи стават все по-"добре написани", което подкопава тяхната стойност. Маринов от Man Group обаче смята, че ръководителите в крайна сметка няма да могат да се сравняват с машините, които се подобряват с повече данни.

"Тук няма правила, това е като автономната кола, която се учи в движение", добавя той. "Така че, в много случаи е невъзможно да се даде на ръководителя списък с думи за наблюдение."