Дресьорите на кучета вече могат да се присъединят към списъка с професионалисти, чиито работни места са застрашени от изкуствения интелект (ИИ) – тъй като той току-що навлезе в света на комуникацията с животни. Използвайки софтуер за машинно обучение, изследователите успяха да разкодират значението на кучешкия лай, проправяйки пътя за нови технологии, които могат да ни помогнат да разберем по-добре нашите четириноги спътници.
Авторите на изследването, което все още не е рецензирано от специалисти, записват лаенето, ръмженето, воя и скимтенето на 74 домашни кучета, които са изложени на различни ситуации, предназначени да предизвикат определени реакции. Те включват всичко – от игра с любимите им играчки до това да наблюдават как няколко от изследователите се преструват, че нападат стопаните им.
На базата на тези записи авторите на изследването идентифицират 14 различни вида кучешка вокализация, като например „позитивен лай“ по време на игра, „лай на тъга/тревога“ и „много агресивен лай към непознат“. Моделът на изкуствения интелект, наречен Wav2Vec2, който първоначално е бил предназначен за разпознаване на човешка реч, е бил обучен на тези кучешки звуци, след което е бил подложен на редица тестове.
Първото от тях включваше разпознаване на отделни кучета въз основа на лая им. Забавно е, че когато изкуственият интелект е бил предварително обучен на човешка реч, преди да се запознае с тази на кучетата, той е успял да идентифицира успешно конкретни кучета в 50% от опитите, докато моделите, обучени само на кучешки звуци, постигат 24% успеваемост…
Това е доста важно, тъй като предполага, че познаването на човешката реч може да помогне на ИИ да се справи със сложността и на нечовешката комуникация, което означава, че не е необходимо да започваме от нулата, когато става въпрос за създаване на модел за говорене конкретно с животни.
„Резултатите ни показват, че звуците и моделите, получени от човешката реч, могат да послужат като основа за анализиране и разбиране на акустичните модели на други звуци, като например вокализациите на животните“, обяснява авторът на изследването Рада Михалчеа в изявление.
По-нататък. Моделът успя да направи разлика между различните породи кучета с различна степен на успех: повече от половината от кучетата в проучването са били чихуахуа и софтуерът е успял да ги идентифицира правилно по лая им в около 75% от случаите.
И накрая – моделът е бил изправен пред предизвикателството да интерпретира значението на вокализациите на животните, като ги съпостави с един от 14-те вида кучешки звуци, изброени от изследователите. При предварително обучение върху човешка реч изкуственият интелект постига успеваемост от 62,2%, като някои категории звуци били по-лесни за разшифроване от други.
Например моделът успява да идентифицира правилно 90,7% от отрицателните ниски звуци, но само 45,26 % от отрицателните високи.
„Има толкова много неща, които все още не знаем за животните, които споделят този свят с нас. Напредъкът в областта на изкуствения интелект може да се използва за революция в разбирането на езика на животните, а нашите открития показват, че може би няма да се наложи да започваме от нулата“, каза Михалчеа.
„Като използваме модели за обработка на речта, първоначално обучени на човешка реч, нашето изследване отваря нов прозорец към това как можем да използваме изграденото досега в областта, за да започнем да разбираме нюансите на кучешкия лай“, каза тя.