Bądź na bieżąco dzięki bezpłatnym aktualizacjom
Po prostu zarejestruj się sztuczna inteligencja myFT Digest – dostarczane bezpośrednio do Twojej skrzynki odbiorczej.
Podczas swojej ostatniej rozmowy telefonicznej w sprawie zarobków jako dyrektor generalny firmy Illumina zajmującej się sekwencjonowaniem genetycznym Francis de Souza dołożył wszelkich starań, aby zachować pozytywne nastawienie.
Kontrowersyjne przejęcie Grail za osiem miliardów dolarów firmy zajmującej się badaniami przesiewowymi w kierunku raka doprowadziło do kampanii prowadzonej przez inwestora-aktywisty Carla Icahna, walk z organami ds. konkurencji po obu stronach Atlantyku i krytyki ze strony dyrektorów założycieli Graala.
D’Souza powiedział analitykom, że ten dramat dotknął tylko „bardzo małą część firmy”.
Jednak według Speech Craft Analytics, która wykorzystuje sztuczną inteligencję do analizy nagrań dźwiękowych, za każdym razem, gdy pytano go o Graala, zmieniało się tempo jego mówienia, ton i głośność. Nastąpił także wzrost liczby słów wypełniających, takich jak „um” i „ach”, a nawet słyszalnych łyków.
Według Davida Pope’a, starszego analityka danych w Speech Craft Analytics, to połączenie „mówi o niepokoju i stresie, szczególnie podczas rozwiązywania tak delikatnej kwestii”.
D’Souza zrezygnował niecałe dwa miesiące później.
Pomysł, że nagrania dźwiękowe mogłyby dostarczyć porad na temat prawdziwych uczuć kadry kierowniczej, przykuł uwagę niektórych z największych inwestorów na świecie.
Wiele funduszy korzysta już z algorytmów do przeszukiwania zapisów rozmów telefonicznych o zarobkach i prezentacji firm w celu zbierania sygnałów na podstawie doboru słów przez kadrę kierowniczą – jest to dziedzina znana jako „przetwarzanie języka naturalnego” lub NLP. Teraz próbują znaleźć więcej przesłania w sposobie wymowy tych słów.
„Chodzi o to, że dźwięk rejestruje coś więcej niż tylko tekst” – powiedział Mike Chen, szef badań nad alternatywnymi wersjami alfa w Rubico Asset Management. „Nawet jeśli masz wyrafinowaną maszynę semantyczną, wychwytuje ona tylko semantykę”.
W tekście zwykle pomija się słowa niepewne i wypełniające, a sztuczna inteligencja może również wychwycić „mikroskoki”, których ludzkie ucho nie widzi.
Robeco, które zarządza funduszami opartymi na algorytmach o wartości ponad 80 miliardów dolarów, co czyni go jedną z największych firm zajmujących się kwantyfikacją, zaczęło na początku tego roku dodawać do swoich strategii sygnały audio przechwytywane przez sztuczną inteligencję. Chen powiedział, że zwiększyło to zyski i spodziewa się, że więcej inwestorów pójdzie w ich ślady.
Użycie głosu stanowi nowy poziom w grze w kotka i myszkę pomiędzy zarządzającymi funduszami a kadrą kierowniczą.
„Odkryliśmy ogromną wartość w tych tekstach” – powiedział Yin Luo, kierownik ds. badań ilościowych w Wolf Research. „Problem, jaki to stworzył dla nas i wielu innych, polega na tym, że nastroje społeczne stają się coraz bardziej pozytywne.[because]„Zarząd firmy wie, że jego wiadomości są analizowane”.
W kilku artykułach naukowych stwierdzono, że prezentacje stają się coraz bardziej pozytywne od czasu pojawienia się programowania neurolingwistycznego (NLP), ponieważ firmy modyfikują swój język w celu manipulowania algorytmami.
Artykuł badawczy, którego współautorem jest Lu na początku tego roku, wykazał, że połączenie tradycyjnego NLP i analizy głosu było skutecznym sposobem na rozróżnienie firm, w miarę jak ich profile stawały się coraz bardziej „standaryzowane”.
Chociaż koszty spadają, podejście to jest nadal stosunkowo drogie. Robeco spędziło trzy lata na inwestowaniu w infrastrukturę nowej technologii, zanim w ogóle rozpoczęło prace nad integracją analizy głosu.
Chen spędził lata na wypróbowywaniu głosu, zanim dołączył do Robeco, ale stwierdził, że technologia nie jest wystarczająco zaawansowana. Chociaż dostępne statystyki są coraz lepsze, nadal istnieją ograniczenia.
Aby uniknąć wyciągania pochopnych wniosków na podstawie różnych osobowości – niektórzy menedżerowie mogą być z natury bardziej emocjonalni niż inni – najbardziej wiarygodna analiza opiera się na porównaniu różnych przemówień tej samej osoby w czasie. Może to jednak utrudnić ocenę wyników nowego lidera – jest to moment, w którym wgląd w sytuację byłby szczególnie przydatny.
„Jednym z ograniczeń nawet w NLP jest to, że zmiana dyrektora generalnego psuje ogólne samopoczucie [analysis]powiedział dyrektor firmy zajmującej się analizą NLP. „Ten efekt zakłócenia powinien być silniejszy w przypadku dźwięku”.
Programiści powinni także unikać dodawania własnych uprzedzeń do algorytmów opartych na dźwięku, w przypadku których różnice takie jak płeć, klasa czy rasa mogą być bardziej widoczne niż w tekście.
„Bardzo dbamy o to, aby świadome uprzedzenia, których jesteśmy świadomi, nie rozprzestrzeniały się, ale możliwe jest, że istnieją nieświadome uprzedzenia” – powiedział Chen. „Posiadanie dużego i zróżnicowanego zespołu badawczego w Robeco pomaga”.
Algorytmy mogą dawać mylące wyniki, jeśli próbują przeanalizować osobę mówiącą w obcym języku, a tłumaczenie symultaniczne, które działa w jednym języku, może nie działać w innym.
Pope spodziewa się, że w miarę jak firmy będą próbowały dostosować się do analizy tekstu, zespoły ds. relacji inwestorskich zaczną szkolić kadrę kierowniczą w zakresie monitorowania tonu głosu i innych zachowań ignorowanych przez teksty. Analiza głosu nie jest łatwa w przypadku wyszkolonych aktorów, którzy potrafią przekonująco zachować się w danej roli, ale w przypadku kadry kierowniczej łatwiej to powiedzieć niż zrobić.
„Bardzo niewielu z nas potrafi modyfikować swój głos” – powiedział. „Łatwiej jest nam ostrożnie dobierać słowa. Uczymy się tego od najmłodszych lat, aby uniknąć kłopotów.
„Odkrywca. Entuzjasta muzyki. Fan kawy. Specjalista od sieci. Miłośnik zombie.”
More Stories
Czy należy Ci się odszkodowanie po wyroku sądu w sprawie finansowania samochodu? | Sektor finansowy
Regulowane opłaty kolejowe w Anglii wzrosną o 4,6%, aby pokonać inflację w 2025 r. | Ceny kolei
Dyrektor generalny Tesli, Elon Musk, odważnie twierdzi, że będzie to ogromne wyzwanie dla Optimusa