Голосовое управление для умного дома

Обзор персональных помощников и возможностей домашней автоматизации

Уже в начале 2000-х, когда я занимался системами умного дома Clipsal, голосовое управление использовалось в проектах автоматизации зданий. В ходе обучения в Великобритании меня привезли в дом престарелых, где в палатах для людей с ограниченной подвижностью была внедрена система распознавания голоса и управления основными параметрами помещений. Даже телевизор переключался голосом! Тогда я думал что пройдёт 2-3 года и эта технология проникнет в каждый дом.

1.jpg

Прошло 15 лет и только сейчас появился кто-то, готовый нас выслушать. Давайте посмотрим, кто.

Наша компания выходит на рынок шлюзовых контроллеров для Homekit, Google Assistant / Home и Amazon Alexa. В связи с этим мы хорошо познакомились с этим рынком и хотим относительно коротко рассказать, что, по нашему мнению, происходит. Материал скорее ознакомительный, не претендует на полноту или истину в последней инстанции — будем рады вашим дополнениям и замечаниям!

Просто понимать речь — мало

Clipsal продавала продукт Homespeak , он использовал платформу Dragon NaturallySpeaking от Nuance и после небольшого обучения вполне сносно разбирал слова. Я даже правильное английское произношение освоил, пока занимался тестами («Eleven!»(c)). Но нажать кнопочку всегда было проще.

Просто распознать голос оказалось недостаточно. Нужно было что-то ещё. В телефонах Samsung есть S Voice или Voice Assistant, но кто ими пользуется?

Чтобы завоевать расположение массового покупателя пришлось добавлять интеллект. Много интеллекта. Приемлемое распознавание голоса приходит к нам как часть гораздо более масштабного продукта — голосовых помощников.

Заглядывать в будущее всегда лучше через искусство. Что трогает наши чувства, тянет к себе и заставляет желать — то со временем исполняется, руками талантливых предпринимателей. Фильм «Она» (2013) голосом Скарлетт Йоханссон показывает нам будущее как на ладони. (Да, я знаю, все видели, просто было приятно вспомнить).

Вот так и вышло, что помощники, которыми мы все с вами со временем будем пользоваться — первый массовый продукт искусственного интеллекта.

Все персональные помощники, занимающие заметное место на рынке — облачные вопросно-ответные системы с элементами искусственного интеллекта с обработкой естественной речи. С кем конкретно мы уже сейчас довольно активно общаемся?

Apple: Siri

Когда говорят, что Apple в ближайшие годы потеряет свои позиции в связи со снижением ценности производства устройств в сторону нейросетей, аналитики и искусственного интеллекта (отдавая здесь пальму первенства Google, Amazon, IBM и Facebook), это немного голословно. Siri, по большому счёту, создана внутри организации, когда-то создавшей сам интернет. Apple купила Siri в 2010 году, получив итог 40-летней разработки, финансируемой DARPA через SRI International. В продукте использованы разработки исследовательских групп из Университета Карнеги — Меллон, Массачусетского Университета, Рочестерского Университета, Флоридского Института Познания Человека и Машины, Университета штата Орегон, Университета Южной Калифорнии и Стэнфордского Университета (источник). Будет очень обидно, если с таким бекграундом мы не получим в скором будущем действительно интеллектуального помощника.

Для распознавания естественной речи используются технологии Nuance (да, со времён Homespeak здесь без революционных изменений). И да, на данный момент это единственный помощник, понимающий русский язык.

Siri — полноценный персональный помощник, он (она?) имеет возможность вступать в диалог с пользователем, задавать дополнительные вопросы. Если ваш iPad находится в гостиной и постоянно подключён к питанию (а мы часто видим это в умных инсталляциях) то он будет работать примерно как Amazon Echo или Google Home по фразе «Привет, Siri».

Amazon: Echo, Dot и Alexa

Alexa — это персональный ассистент от Amazon. Echo — умная беспроводная акустическая система, подключенная к сервису. У Echo есть «мини ми» — это Echo Dot. Маленький и недорогой микрофон с простым спикером для голосовых ответов. Также у него есть разъем 3.5мм и bluetooth для подключения к сторонней звуковой системе. Ещё есть Echo Tap, мобильная версия на батарейках и Echo Show — с экраном и видеозвонками.

Вот он, первый большой хит пользовательского Интернета вещей. К январю 2017 было продано более 8 миллионов устройств и есть большая вероятность, что до конца 2017 года будет продано ещё около 20-ти миллионов. И это с учётом того, что она пока поддерживает только английский язык.

Google: Now, Home и Assistant

Now был запущен в 2012 году как голосовой ассистент поиска и конкурент Siri. По большому счёту персональным помощником он не считается, потому что он не вступает в диалог. Это прерогатива следующего этапа развития сервиса — встроенного в некоторые телефоны и приложения Google Assistant и беспроводного динамика Google Home.

Лучшее, что есть в Home — контекстная ориентированность. Вы можете ему сказать — «Окей гугл, выключи свет в спальне». И через некоторое время добавить «Окей гугл, установи температуру на 21 градус». И он поменяет температуру именно в спальне, в то время как Siri и Alexa не поймут или переспросят. К сожалению, пока не получится сказать это на русском, но есть надежда на cкорое исправление ситуации.

Microsoft: Cortana

В 2013 году Microsoft представила свою версию персонального ассистента. Разрабатывалась она с 2009 года в команде Speech. Пока поддерживает всего несколько языков и русского среди них нет. В силу отсутствия успешных массовых устройств Microsoft пока представляет для домашней автоматизации наименьший интерес.

Есть и другие.

Например Кубик Юрия Бурова. И да, он работает с контекстом.

Самое весёлое, конечно, заставить их болтать друг с другом.

Как они работают с умным домом?

Конечно все персональные помощники задумываются о выходе на рынок, который через пару лет станет крупнейшим в мире.

Apple довольно консервативно подошла к вопросу, что многим импонирует. Siri распознаёт команды в облаке, потом возвращает результат и уже локально управляет устройствами через Homekit. То есть сам процесс управления происходит в локальной сети.

Мы встречались с представителями Apple в Амстердаме, они с грустью сообщили, что пока не планируют официально сертифицировать шлюзы, кроме пары довольно закрытых устройств. Мол, нужно быть точно уверенными, какие устройства подключены к мосту. Наш подход в принципе другой, количество устройств будет постоянно расти, так что пришлось смириться с предупреждением при первом подключении.

Amazon с Google подходят по-другому. Нужно использовать приложения (у Echo они называются skills), которые в облаке обрабатывают запросы и исполняют нужные задачи. И взаимодействует это приложение с внешними облаками и приложениями в них, типа IFTTT.

Много ли устройств совместимо? Несколько сотен. Если взять весь рынок — наверное процентов 15. Кто-то скажет, что остальные 85 устарели и скоро уйдут с рынка. На самом деле нет.

Часть из этих 85% — стартапы, которым не хочется тратить деньги на совместимость. Другие — профессиональные системы автоматизации, которые и не думают терять своё место на рынке. Взгляните, например, на рынок Китая:

Так и вышло, что наша платформа очень хорошо вписалась в эту картину, где на рынке есть желанные устройства, а совместимости с большей частью рынка даже не предвидится.

Модули Echo и Homekit уже появились в нашем магазине, в скором времени за ними последует Google Home. Специализированный контроллер iRidium gate for Homekit можно установить в уже существующие проекты «умных» систем

Осталось дождаться, пока остальные ассистенты, кроме Siri, начнут понимать русский язык и ещё, хотя-бы чуточку, поумнеют.

 

Директор по развитию ООО Иридиум
Николай Русанов