В редакции вот уже несколько дней живёт Алиса – голосовой помощник, встроенный в новую умную колонку Яндекс.Станция (мы её уже изучили, вот обзор).
Сначала мы пытались подружиться с этой дамочкой: «Алиса, какая погода в Москве?», «Алиса, сделай музыку потише» и прочие простые команды выполнялись без проблем. Но нарастающее чувство неловкости уже на следующий после покупки день отбило всякое желание общаться с голосовым помощником.
И причин тому несколько. Главное – мы всё ещё теряемся при общении с искусственным интеллектом.
А вот и другие проблемы:
1. Голосовые помощники имитируют человеческий голос, но не стиль общения
Признайтесь, что с людьми вы общаетесь гораздо чаще, чем с искусственным интеллектом, да? Лично я – точно чаще. Именно поэтому механическое проговаривание слов мне некомфортно слышать. Мало того, безжизненный голос вгоняет меня в ступор и путает мысли.
Как следствие – я делаю паузы, пытаясь выстроить в голове максимально корректную фразу, что приводит к репликам голосового помощника типа «я вас не поняла» и «повторите, пожалуйста».
Да я ещё ничего не сказал, глупая железяка!
Шутки в исполнении той же Алисы, произносимые с механическими интонациями, вообще звучат крайне жутко для меня. Сразу вспоминаются фильмы типа «Я-робот» и другие неуютные фантазии на тему доминирования машин над человеком.
Та же Siri на моем iPhone – я изредка пользуюсь её услугами, чтобы поставить таймер или будильник. На большее, вроде диктовки сообщений, у меня не хватает терпения.
Что касается Алисы, то этот помощник строит предложения очень не по-человечески: например, если спросить её «Алиса, сколько времени займёт путь до (название улицы)», то в ответ она ответит «до улицы (название) время в пути составит столько-то минут».
Это слушается неестественно, ведь я уже озвучил название улицы в вопросе, какой смысл дублировать это название в ответе? Такие диалоги не дают забыть, что ты пытаешься общаться с программой, которой ещё далеко до человеческой имитации.
2. Слово не воробей: вылетит – не исправишь
Все голосовые помощники очень ограничены в восприятии орфографических нюансов. Например, Сири не может понять слово «человечество», постоянно меняя его на «человечествА».
Я понимаю, что в плане окончаний русский язык достаточно сложный, по сравнению с английским. Но мне интересно, насколько хорошо голосовые помощники различают, например, испанские слова, в которых одна буква в окончании способна полностью поменять смысл слова.
Если сравнивать два сценария поиски информации в интернете:
1. Я в уме составляю предложение, произношу его, голосовой помощник слышит мои слова неправильно. Мне приходится снова активировать помощника и перефразировать свое предложение, возможно несколько раз
2. Я открываю браузер и вбиваю в поиск нужные слова. Через доли секунд я вижу на экране результат.
Понятно, что сценарий без голосового помощника предпочтительнее. И дело тут даже не в возможной косноязычности, а в несовершенстве программы, имитирующей человеческий голос.
Но для меня-то, это неважно. Мне важно быстро получить ответ на свой запрос, потому что 21 век приучил меня к мгновенному обмену информацией. Тут есть два выхода – отказаться от использования Алисы, Сири, Кортаны и прочих ассистентов, или привыкать говорить на понятном им языке.
А опускаться в своей речи до уровня бездушной машины мне не хочется.
3. Голосовым помощникам нет доверия. Могут подставить
Одно из главных отличий программы от человека – отсутствие моральных и этических норм. Голосовой помощник может запросто отправить сообщение или начать дозвон ненужному в данный момент абоненту просто потому, что неправильно расслышал мою речь.
Это совершенно неприемлемо, и в большинстве случаев именно гипотетическая возможность подобных ситуаций буквально отпугивает тех же владельцев iPhone от общения с Siri.
Вдруг я скажу: «Привет, Сири! Соедини меня с Cisco», а глупая программа начнет звонить абоненту «Киска». Мне такой сценарий совершенно не нужен.
Учитывая, что подобных примеров в интернете можно найти великое множество, нам всем нужно помимо изучения особенностей разговорного этикета с программой осваивать писательский талант.
Слабо переименовать все контакты в телефонной книге так, чтобы у голосового ассистента не было ни единого шанса ошибиться в выборе?
4. Мы всё ещё не привыкли общаться с машинами
В целом, основная проблема всех голосовых ассистентов в том, что они до сих пор плохо распознают человеческую речь.
Несмотря на колоссальные суммы в миллиарды долларов, которые ведущие компании тратят на разработку ИИ, интеллект программы всё ещё слишком далёк от совершенства.
Есть мнение, что на данный момент интеллект голосовых помощников даже ниже, чем у обыкновенной пчелы.
Вы когда-нибудь пробовали разговаривать с пчёлами?
Так что сегодня для плодотворного общения с Siri, Алисой и прочими псевдо-человеческими имитациями нужно отключить свой навык красноречия и научиться выражаться простыми короткими фразами.
А если вспомнить, что вместо написания слов мы всё чаще используем пиктограммы Эмодзи, так и до всеобщей деградации недалеко.
Поэтому у нас в офисе вот уже 3-й день Алиса молчит. Гораздо надёжнее и приятнее самому регулировать звук, смотреть маршрут в картах на смартфоне и узнавать погоду на профильных сайтах визуально.
Или нет? Быть может, вы нашли общий язык с голосовым ассистентов в своем гаджете? Расскажите нам в комментариях!
14 комментариев
Форум →Перднуть спокойно уже нельзя без прослушки
Стрёмно говорить в Метро или в Парке с телефоном )
Другие могут не так понять.
@Karatel Karatel, когда то было стремно вообще говорить на улице по телефону. А до этого было стремно ехать на безлошадном экипаже.
@Karatel Karatel, знаете, что реально стремно? Газпромбанк год-другой назад внедрил у себя голосовой IVR вместо обычного тонового. И вот вы набираете номер банка, чтобы решить какой-то вопрос с оператором, «интеллектуальный» помощник спрашивает, чем может быть полезен, вы ему говорите соединить с оператором, он у вас переспрашивает, быть может он чем-то может помочь, а то оператора можно долго ждать, на что вам приходится ещё раз озвучивать просьбу соединить с оператором. Да – прикольно, да – он нормально разбирает речь, но, ей-богу, чувствуешь себя дауном при попытке добиться связи с оператором. И много пути нет. Вот где полный 3.14здец.
@tov.Polkovnik, это сделано специально, оператор который вам ответит стоит денег, любая компания по максимуму старается избежать общения клиента с оператором.
@PavelDemyanov, все несколько иначе, но в целом вы правы. Понимаете, просто раньше не было проблем, когда IVR был тоновый (то есть на кнопках), а теперь вот такая дебильная шляпа. Причём все, у кого Газпромбанк и кого я спрашивал, жаловались.
@tov.Polkovnik, уходите с Газпромбанка. Если зарплатная, то лучше пользоваться альфой, тинькофф.
@A.Si495, у меня зарплатных проект, я работаю в этой структуре. Можно, конечно, поменять, но мне не принципиально. Основная карта у меня Райф.
У меня Сири Человечество понимает без проблем
Я не пользуюсь и не пользовался сири никогда и вообще голосовыми помощниками. Они у меня отключены за ненадобностью. Максимум в яндекс навигатор командовал названия улиц. И то проверять все равно приходиться. Проще и быстрее просто вбить название.
Как то так.
@RSV, когда регулярно ездишь за рулем, то Сири выручает.
«Это слушается неестественно, ведь я уже озвучил название улицы в вопросе, какой смысл дублировать это название в ответе?»
Смысл в том, чтобы можно было удостовериться в том, что ассистент правильно и корректно расслышал запрос. Вы сами ниже не раз писали, что у ассистентов проблема с распознаванием речи.
Пользуюсь Siri постоянно, так как никогда не включаю свой iPad Pro зажатием механической клавиши (ну или крайне редко). Вместо этого я вызываю Siri и говорю, какое приложение открыть. В итоге происходит не только бесконтактная разблокировка устройства, но и экран включается сразу на нужном приложении. Так же погоду узнаю по простой команде “Погода”, ни словом больше (зачем для этого ходить на профильные сайты?). Так же и время узнать, когда сонный с утра лежишь в кровати, и не хочешь тянуться к iPad и открывать глаза: “Привет Siri! Время”. “Привет, Siri! Какой заряд Apple Pencil”. Всё это простые но полезные и удобные для меня команды, которыми я пользуюсь постоянно.
Возмущает, что версия Siri для русского языка уже чёрт знает сколько не может корректно обрабатывать числовые запросы в виде десятков тысяч, вроде “Двадцать тысяч”, “Тридцать тысяч” и т.д. В итоге выход пока один: с тупым ассистентом на тупом языке: “Двадцать пробел ноль ноль ноль рублей в долларах”. Только в этом случае запрос будет обработан корректно.
Для людей, потерявших зрение, это реальный выход из темноты. Вы вредничаете, потому что избалованы гаджетами – вам удобства подавай! Удивительно, но многим лень кнопку нажать…
Рановато рассчитывать на “человеческое” восприятие голосовых помощников – реальный “ум” будет стоить дорого.
Может сюда заглядывают разработчики Яндекс, Алисы)
Обращение к соотечествиникам, так как это пока самый комфортный голосовой помошник.
Собственно просьба. Нарисуйте анимированое лицо девушки.
Я не понимаю почему это ни гугл, ни эпл не делает. Ну, не могу я общаться с куском пластика, или с иконкой.
Что бы было комфортно общаться, софт заключенный в пластик, должен иметь лицо с умеренной харизмой.
Ребятушки из Яндекса увидьте этот комент:)
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Как сделать копирование текста и фото удобным на iPhone
Как быстро скрыть все иконки с рабочего стола Mac
Не работает AirDrop между устройствами. Что делать?
Шпионское приложение, которое снимет на фото всех, кто захочет зайти в ваш iPhone или iPad без разрешения
iPhone неверно поворачивает интерфейс при наклоне?
Что делать, если после обновления iOS или macOS задвоились контакты
Как правильно выбрать приложение по умолчанию в iOS 14
Что делать, если экран iPhone выключается во время воспроизведения видео