Анастасия Кириченко
Начинающий художник, настольный игроман и жуткий любитель природы

ИИ-приложение транскрибирует разговоры в режиме реального времени

Фото: Mashable
Фото: Mashable

Если в ходе своей профессиональной деятельности вам приходится заниматься транскрипцией, то в лице нового приложения Otter вы найдете верного помощника. Приложение представляет собой бесплатный сервис, который транскрибирует речь с высокой точностью посредством искусственного интеллекта.

Это новая разработка, цель которой — сделать голосовую транскрипцию такой же легкой и простой, как обычный голосовой набор в Google Doc. В основе приложения лежит распознавание речи – технология, которой сейчас одержимо множество гигантов индустрии.

В то же время, компании типа Amazon, Google и Apple нередко не могут в полной мере раскрыть все функции в таких приложениях как Alexa или Siri, обещая, что полноценное голосовое управление будет доступно в следующих поколениях приложений. Наряду с этим, речевым транскрипциям уделяется все меньше внимания, несмотря на то, что технология, эффективно переводящая аудиозапись в текст может быть востребована среди людей различных профессий.

Большую часть доступных на рынке приложений можно смело разделить на две категории. Первые — бесплатны, но получаемый текст часто не соответствует записи. Иными словами, качество обработки оставляет желать лучшего.

Вторые — платные и позволяют получить текст достаточно высокого качества. Такое явление обусловлено сложностью перевода голосового сообщения в текстовое, ввиду этого качественная транскрипция нередко требует участия человека.

Фото: Digital Trends
Фото: Digital Trends

Однако приложение Otter, дебютировавшее на Mobile World Congress, задается целью сделать процесс трансформации не только качественным, быстрым и бесплатным, но еще и «умным». CEO и основатель AISense, разработчика Otter, Сэм Лян, заявил:

Это прекрасное время — благодаря возможностям искусственного интеллекта и его глубокому изучению, за последние несколько лет точность распознавания речи значительно улучшилась.

Приложение Otter отличается простотой использования. Так, практически сразу после того, так пользователь нажмет значок микрофона и начнет говорить, появляется черновая текстовая запись сказанного. После того, как запись заканчивается, за работу принимается искусственный интеллект, который «подчищает» текст.

Особенность приложения заключается в том, что он идентифицирует своего владельца и человека, который, к примеру, дает интервью. Благодаря этому цельные абзацы текста разделяются на реплики, понятные и простые для восприятия.

Перед началом использования приложения, пользователь должен оставить «головой отпечаток». Для этого нужно прочитать приложению несколько предложенных предложений. Благодаря этому программа сможет распознать голос пользователя и отделить его ото всех остальных.

Функции разбора речи работают не только в режиме реального времени — пользователь может загрузить в Otter уже имеющиеся записи для их последующего разбора. Каждый отдельный файл в приложении отличается собственным набором ключевых слов, так вы сможете быстро найти именно тот документ, который сейчас необходим. Кроме того, посредством Otter можно делиться файлами с друзьями и коллегами через интернет.

Удобно то, что голосовая и текстовая запись синхронизированы. Иными словами, нажав на определенный участок текста, можно быстро проверить точность разбора, посредством прослушивания выбранного участка записи. Аналогичен принцип прослушивания записи — по мере воспроизведения, программа подсвечивает слова тестовой записи, соответствующие конкретному участку.

Фото: CNET
Фото: CNET

Разумеется, и это приложение не безупречно. Его слабыми сторонами является правильное распознавание определенных слов и расстановка знаков препинания. Однако разработчики планируют и дальше работать над совершенствованием своего программного продукта, расширением его функциональных возможностей и перечня совместимых устройств.

Пока же Otter доступен владельцам устройств на ОС Android, а также обладателям техники Apple.

Источник: CNET