SOVA.AI
Мы делаем умного помощника и умную колонку. https://sova.ai/

Технологическое торнадо: кто следующий?

В докладе на Всемирном экономическом форуме 2017 в Давосе профессор Клаус Шваб написал: “Человечество стоит на краю новой технологической революции, которая кардинально изменит то, как мы живём и работаем и относимся друг к другу. Подобного масштаба и сложности перемен человечеству еще никогда не доводилось испытывать. Конечно, сейчас невозможно предвидеть, как она будет разворачиваться, но уже сейчас очевидно, что она затронет все группы, слои и прослойки человечества, все профессии и т.д.”

Технологическое торнадо: кто следующий?
Источник: Unsplash.

Сейчас мы живем в эпоху третьей волны интереса к ИИ. Первая волна (1950—1960-е гг.) была связана с работами по машинному переводу и игровым программам, вторая (1980-е) — развитие экспертных систем. Третья волна началась в конце 1990-х годов и обусловлена не только возросшей производительностью компьютеров, но и существенным продвижением по многим направлениям в области ИИ и программами роботизации.

В этой статье поговорим об искусственном интеллекте, а также я расскажу о том, что по моему мнению должны уметь домашние роботы и виртуальные ассистенты, и что ждет эту отрасль в будущем.

Что такое искусственный интеллект?

Искусственный интеллект – это такая иллюзия, вызванная голливудскими фильмами и фантастикой. Сложился такой образ, что это человекоподобные роботы, которые либо восстают против человека, либо живут в семьях, испытывают эмоции, их не отличить от людей и так далее. Все это не имеет к реальной жизни никакого отношения.

Искусственный интеллект – это инженерная дисциплина, которая занимается имитированием или выполнением когнитивных функций человека, то есть функций, связанных с обработкой информации. Это просто набор методов оптимизации машинного обучения, которая позволяет эту функцию взять и научиться исполнять ее на компьютере. Функция Т9 в смартфонах, поисковик, проверка правописания, распознавание мелодий в Shazam'е, антивирус, антиспам и так далее - это все сложные программы искусственного интеллекта, которые сейчас кажутся обыденными. А вот создание сознания в машине, скорее всего, невозможно. Потому что человечеству до сих пор неизвестно, что такое сознание.

Плюсы и минусы ИИ

Положительные свойства ИИ – это когда создаются конкретные программы, помогающие что-то делать, а минусы — это риски, которые довольно высоки. Во-первых, программы ИИ могут занимать рабочие места. Конечно, они не увольняют людей, людей увольняют компании. Например, в случае с лифтом, который навсегда заменил профессию лифтера, стали востребованы специалисты по их обслуживанию. Какие-то профессии исчезают, но на их место всегда приходят новые.

Во-вторых, искусственный интеллект используется для анализа большого объема данных. Если собрать много данных о людях, то станет возможно вычислить все что угодно. Полностью исчезает приватность. Это не очень хорошая ситуация.

Технологического торнадо

Есть такой исследователь Джеффри Мур (Geoffrey Moore), который написал несколько великолепных книжек про законы развития технологических отраслей и стартапов, в частности. Одна из них — это "Преодоление пропасти" (Crossing the Chasm). Может быть, кто-то из вас её читал. Если нет, то очень рекомендую прочесть. Вторая его книга про то же — "Внутри торнадо" (Inside the Tornado). Он в ней вводит понятие «технологического торнадо» (technology tornado) - взрывообразного развития новой технологической отрасли.

Книги Джеффри Мура
Книги Джеффри Мура

Мы такие торнадо с вами видели на примере персонального компьютера от Джобса и Гейтса. Затем, это было торнадо программного обеспечения в конце 80-х и начале 90-х. Затем в середине 1990-х произошел взрыв Интернета. Появлялись гигантские компании, на пустом месте делались головокружительные карьеры и состояния. Затем мы увидели мобильники, а потом — смартфоны и планшеты.

Во всех этих случаях были общие процессы и закономерности. Самое интересное для нас – как выглядит состояние будущей отрасли «накануне торнадо». Что происходит в этот период? В первую очередь, это отсутствие всякого рынка, и самое главное — это “туман в мозгах”. Все чувствуют, что что-то готовится, но никто не знает, что.

Способ использования – основное условие торнадо

Причиной возникновения торнадо является то, что кто-то предложил способ использования устройства или технологии. Способ использования — это то, что сделал Стив Джобс со смартфонами. Смартфоны производились за несколько лет до того, как появился iPhone. Ему не нужно было изобретать технологии. Нужно было их собрать вместе и сказать — вот эта штука, которая называется так-то, и вот так-то ее надо использовать. Надо дать пользователям эту концепцию и дать производителю направление развития. Тогда возникает рынок и пользователи. И тогда приходит и взрывается над головами технологическое торнадо.

Вот ещё пример — автомобильная промышленность. Она была ровно в таком же состоянии «накануне», пока Форд не построил свой конвейер и не начал производить тот автомобиль, который мы знаем. И не стоит забывать об интернете от Джима Кларка. Джима Кларка, может быть, никто из вас и не знает или знают не все, но это человек, который, собственно, и сделал Интернет. Он нанял автора первого некоммерческого браузера, сделал настоящий браузер, а именно Netscape Navigator, и после этого все взорвалось.

Про роботов и виртуальных ассистентов

Настоящее технологическое торнадо в робототехнике возникнет там, где будут вовлечены миллионы, а точнее – сотни миллионов пользователей. Скорей всего, это будет какой-то персональный робот-ассистент, который живет с людьми, как Дживс или Джарвис, и во всем участвует: в жизни семьи или конкретного человека, в бизнесе и так далее. Такой персональный робот будет у каждого, или будет к этому стремиться. Вот тогда и произойдёт следующее торнадо. Это то, что по-английски называется «the next big thing».

Мы начали делать виртуальных собеседников (virtual assistants) еще в начале 2000-ых годов, очень простых, причем тогда мы еще использовали AIML — artificial intelligence markup language, который и сейчас используется группой энтузиастов вокруг профессора Ричарда Уоллеса (Richard Wallace, A.L.I.C.E. project - author).

Опыт существующих систем общения таков, что виртуальные собеседники затягивают, но в конце концов они тоже надоедают. Это потому, что у них слишком малая полнота. Виртуальный собеседник — тоже система распознавания, как и поисковые машины. Но в поисковой машине важна точность, то есть ранжирование в первой десятке, а полнота абсолютно не важна, потому что в Интернете всегда есть 10 миллионов страниц примерно про то, что вы спросили.

У виртуального собеседника — ровно наоборот. Точность у него всегда 100% — если он понял вопрос, то он отвечает всегда релевантно. А вот полноту сложно покрыть, потому что разнообразие того, что человек может у него спросить, настолько велико, что никогда не удастся предугадать все варианты. Приходится строить концентрические круги от точного ответа к разумному.

Виртуальный собеседник должен уметь перехватывать инициативу, то есть лингвистический интеллект должен быть довольно серьёзный. Он должен обучаться, больше узнавать о своих хозяевах, запоминать что-то про них. Это запоминание поможет оказать консультацию, помощь в домашних делах или построить планы, исходя из образа жизни владельца. Должно быть машинное зрение, чтобы распознавать владельцев или обнаруживать, что кто-то зашёл в комнату и молчит, чтобы самому начать с ним разговор.

Правильно, чтобы виртуальный собеседник имел полезные функции: умел отвечать, какая погода будет завтра, сколько времени, есть ли пробки и т.п. Должно быть разнообразие общения на разные темы, совместные игры. Не менее важен захват аудио канала: чтобы ты мог проснуться, и, когда у тебя нет экрана под рукой, ты мог бы в воздух спросить то, что тебе нужно. Например, когда в 2015 году мы делали робота Лекси (Lexy), мы использовали массивы микрофонов с возможностью фильтрации посторонних шумов. Человек мог дать команду находясь на большом расстоянии от устройства, и система могла ее точно распознать.

Перспективы голосовых помощников (voice assistants)

Приложения на телефонах умрут, ими никто не будет пользоваться.

Распознавание речи будет встроено практически в любое устройство, которое в состоянии эту речь принять и обработать, там, где есть узкая предметная область (в чайник, стиральную машину, микроволновку и так далее). Большинство людей не читают инструкцию, и используют обычно несколько процентов функциональности своих устройств. Если туда встроить голосового помощника, устройство можно будет использовать эффективнее.

Голосовые помощники будут везде, где есть массовое обслуживание.

Голосовые помощники будут и в банкоматах, и в торговых центрах, и так далее. Мы уже продаем чат-ботов в крупные компании для оказания технической поддержки или приема заказов, это и будет продолжаться и развиваться, но уже с внедрением речевых технологий. В скором времени на входе в магазин вас будет встречать механическая женщина, которая будет вас расспрашивать, что вам нужно, и консультировать по ассортименту товаров или услуг.

В конце концов, будет сделан домашний компаньон.

Товарищ не только для ребенка, но и для взрослых. У него будет доступ в википедию, в поисковики, к курсам, он сможет научить английскому и так далее. И самое главное, сможет поддерживать естественный свободный диалог на обычном языке. Сделать это будет непросто, мы знаем это не по наслышке, так как сейчас сами работаем над таким проектом. Я думаю, что до появления таких помощников остается примерно года два-три.

Собственно, над этим и работают в проекте SOVA: над созданием платформы (как Android) для виртуальных ассистентов, и самого умного помощника SOVA, как в виде приложения, так и в виде умной колонки SOVA.

Подробности на сайте проекта.


Материал подготовлен командой проекта SOVA на основе этих материалов.