Разработан алгоритм оценки эмоционального окраса речи
Современные автоматизированные системы могут распознавать как отдельные слова в человеческой речи, так и целые предложения, сообщают представители MIT, а некоторые такие системы способны к обучению и развитию собственных навыков. Но для каждой из них определение эмоциональной окраски речи становится непосильной задачей, а эта задача зачастую ложится на людей.
Новый алгоритм от американских специалистов активно задействует механизмы глубинного машинного обучения для анализа информации как в формате аудио, так и в виде текстовых транскрипций. По состоянию на сегодняшний день точность определения общего тона речи уже достигла 83%.
Тестирование нового алгоритма проводилось в реальных условиях: был проведен эксперимент, участники которого носили на запястьях особое устройство, названное авторами Samsung Simband и очень напоминающее смарт-часы Samsung Gear S. С помощью данного гаджета устройство записывалось и затем переводилось в текстовую форму, а встроенные в сам браслет датчики работали в штатном режиме и получали дополнительную информацию о текущем состоянии здоровья своего владельца. Все эти данные затем передавались на компьютер с запущенным алгоритмом для анализа.
До коммерциализации новой технологии остается еще много времени – ей предстоит пройти ряд тестов и улучшить свои показатели с 83% почти до 100%. По словам ученых, их разработка очень пригодится в области медицины и пригодится людям, страдающим синдромом Аспергера и рядом других расстройств личности, мешающих правильно воспринимать эмоциональный окрас речи собеседника.