iPhones.ru

Мы не знаем, как общаться с голосовыми ассистентами. Это проблема

Микк Сид avatar | 14
FavoriteLoading В закладки
Мы не знаем, как общаться с голосовыми ассистентами. Это проблема

В редакции вот уже несколько дней живёт Алиса – голосовой помощник, встроенный в новую умную колонку Яндекс.Станция (мы её уже изучили, вот обзор).

Сначала мы пытались подружиться с этой дамочкой: «Алиса, какая погода в Москве?», «Алиса, сделай музыку потише» и прочие простые команды выполнялись без проблем. Но нарастающее чувство неловкости уже на следующий после покупки день отбило всякое желание общаться с голосовым помощником.

И причин тому несколько. Главное – мы всё ещё теряемся при общении с искусственным интеллектом.

А вот и другие проблемы:

1. Голосовые помощники имитируют человеческий голос, но не стиль общения

Признайтесь, что с людьми вы общаетесь гораздо чаще, чем с искусственным интеллектом, да? Лично я – точно чаще. Именно поэтому механическое проговаривание слов мне некомфортно слышать. Мало того, безжизненный голос вгоняет меня в ступор и путает мысли.

Как следствие – я делаю паузы, пытаясь выстроить в голове максимально корректную фразу, что приводит к репликам голосового помощника типа «я вас не поняла» и «повторите, пожалуйста».

Да я ещё ничего не сказал, глупая железяка!

Шутки в исполнении той же Алисы, произносимые с механическими интонациями, вообще звучат крайне жутко для меня. Сразу вспоминаются фильмы типа «Я-робот» и другие неуютные фантазии на тему доминирования машин над человеком.

Та же Siri на моем iPhone – я изредка пользуюсь её услугами, чтобы поставить таймер или будильник. На большее, вроде диктовки сообщений, у меня не хватает терпения.

Что касается Алисы, то этот помощник строит предложения очень не по-человечески: например, если спросить её «Алиса, сколько времени займёт путь до (название улицы)», то в ответ она ответит «до улицы (название) время в пути составит столько-то минут».

Это слушается неестественно, ведь я уже озвучил название улицы в вопросе, какой смысл дублировать это название в ответе? Такие диалоги не дают забыть, что ты пытаешься общаться с программой, которой ещё далеко до человеческой имитации.

2. Слово не воробей: вылетит – не исправишь

Все голосовые помощники очень ограничены в восприятии орфографических нюансов. Например, Сири не может понять слово «человечество», постоянно меняя его на «человечествА».

Я понимаю, что в плане окончаний русский язык достаточно сложный, по сравнению с английским. Но мне интересно, насколько хорошо голосовые помощники различают, например, испанские слова, в которых одна буква в окончании способна полностью поменять смысл слова.

Если сравнивать два сценария поиски информации в интернете:

1. Я в уме составляю предложение, произношу его, голосовой помощник слышит мои слова неправильно. Мне приходится снова активировать помощника и перефразировать свое предложение, возможно несколько раз

2. Я открываю браузер и вбиваю в поиск нужные слова. Через доли секунд я вижу на экране результат.

Понятно, что сценарий без голосового помощника предпочтительнее. И дело тут даже не в возможной косноязычности, а в несовершенстве программы, имитирующей человеческий голос.

Но для меня-то, это неважно. Мне важно быстро получить ответ на свой запрос, потому что 21 век приучил меня к мгновенному обмену информацией. Тут есть два выхода – отказаться от использования Алисы, Сири, Кортаны и прочих ассистентов, или привыкать говорить на понятном им языке.

А опускаться в своей речи до уровня бездушной машины мне не хочется.

3. Голосовым помощникам нет доверия. Могут подставить

Одно из главных отличий программы от человека – отсутствие моральных и этических норм. Голосовой помощник может запросто отправить сообщение или начать дозвон ненужному в данный момент абоненту просто потому, что неправильно расслышал мою речь.

Это совершенно неприемлемо, и в большинстве случаев именно гипотетическая возможность подобных ситуаций буквально отпугивает тех же владельцев iPhone от общения с Siri.

Вдруг я скажу: «Привет, Сири! Соедини меня с Cisco», а глупая программа начнет звонить абоненту «Киска». Мне такой сценарий совершенно не нужен.

Учитывая, что подобных примеров в интернете можно найти великое множество, нам всем нужно помимо изучения особенностей разговорного этикета с программой осваивать писательский талант.

Слабо переименовать все контакты в телефонной книге так, чтобы у голосового ассистента не было ни единого шанса ошибиться в выборе?

4. Мы всё ещё не привыкли общаться с машинами

В целом, основная проблема всех голосовых ассистентов в том, что они до сих пор плохо распознают человеческую речь.

Несмотря на колоссальные суммы в миллиарды долларов, которые ведущие компании тратят на разработку ИИ, интеллект программы всё ещё слишком далёк от совершенства.

Есть мнение, что на данный момент интеллект голосовых помощников даже ниже, чем у обыкновенной пчелы.

Вы когда-нибудь пробовали разговаривать с пчёлами?

Так что сегодня для плодотворного общения с Siri, Алисой и прочими псевдо-человеческими имитациями нужно отключить свой навык красноречия и научиться выражаться простыми короткими фразами.

А если вспомнить, что вместо написания слов мы всё чаще используем пиктограммы Эмодзи, так и до всеобщей деградации недалеко.

Поэтому у нас в офисе вот уже 3-й день Алиса молчит. Гораздо надёжнее и приятнее самому регулировать звук, смотреть маршрут в картах на смартфоне и узнавать погоду на профильных сайтах визуально.

Или нет? Быть может, вы нашли общий язык с голосовым ассистентов в своем гаджете? Расскажите нам в комментариях!

1 Звезд2 Звезды3 Звезды4 Звезды5 Звезд (3 голосов, общий рейтинг: 4.33 из 5)
undefined
iPhones.ru
Ещё рано?
Здесь можно оставить комментарий! Для этого авторизуйтесь или зарегистрируйтесь на iPhones.ru.

14 комментариев

Форум →
  1. NoRobot avatar
    NoRobot 13 июля 2018
    6

    Перднуть спокойно уже нельзя без прослушки

    Войди на сайт, чтобы ответить
    Ответить
  2. Karatel Karatel avatar
    Karatel Karatel 13 июля 2018
    0

    Стрёмно говорить в Метро или в Парке с телефоном )
    Другие могут не так понять.

    pLoskutov avatar
    pLoskutov13 июля 2018
    2

    @Karatel Karatel, когда то было стремно вообще говорить на улице по телефону. А до этого было стремно ехать на безлошадном экипаже.

    tov.Polkovnik avatar
    tov.Polkovnik13 июля 2018
    0

    @Karatel Karatel, знаете, что реально стремно? Газпромбанк год-другой назад внедрил у себя голосовой IVR вместо обычного тонового. И вот вы набираете номер банка, чтобы решить какой-то вопрос с оператором, «интеллектуальный» помощник спрашивает, чем может быть полезен, вы ему говорите соединить с оператором, он у вас переспрашивает, быть может он чем-то может помочь, а то оператора можно долго ждать, на что вам приходится ещё раз озвучивать просьбу соединить с оператором. Да – прикольно, да – он нормально разбирает речь, но, ей-богу, чувствуешь себя дауном при попытке добиться связи с оператором. И много пути нет. Вот где полный 3.14здец.

    PavelDemyanov avatar
    PavelDemyanov14 июля 2018
    0

    @tov.Polkovnik, это сделано специально, оператор который вам ответит стоит денег, любая компания по максимуму старается избежать общения клиента с оператором.

    tov.Polkovnik avatar
    tov.Polkovnik14 июля 2018
    0

    @PavelDemyanov, все несколько иначе, но в целом вы правы. Понимаете, просто раньше не было проблем, когда IVR был тоновый (то есть на кнопках), а теперь вот такая дебильная шляпа. Причём все, у кого Газпромбанк и кого я спрашивал, жаловались.

    A.Si495 avatar
    A.Si49514 июля 2018
    0

    @tov.Polkovnik, уходите с Газпромбанка. Если зарплатная, то лучше пользоваться альфой, тинькофф.

    tov.Polkovnik avatar
    tov.Polkovnik14 июля 2018
    0

    @A.Si495, у меня зарплатных проект, я работаю в этой структуре. Можно, конечно, поменять, но мне не принципиально. Основная карта у меня Райф.

    Войди на сайт, чтобы ответить
    Ответить
  3. nDimka avatar
    nDimka 13 июля 2018
    1

    У меня Сири Человечество понимает без проблем

    Войди на сайт, чтобы ответить
    Ответить
  4. RSV avatar
    RSV 13 июля 2018
    1

    Я не пользуюсь и не пользовался сири никогда и вообще голосовыми помощниками. Они у меня отключены за ненадобностью. Максимум в яндекс навигатор командовал названия улиц. И то проверять все равно приходиться. Проще и быстрее просто вбить название.
    Как то так.

    A.Si495 avatar
    A.Si49514 июля 2018
    1

    @RSV, когда регулярно ездишь за рулем, то Сири выручает.

    Войди на сайт, чтобы ответить
    Ответить
  5. Alex Bolton avatar
    Alex Bolton 14 июля 2018
    2

    «Это слушается неестественно, ведь я уже озвучил название улицы в вопросе, какой смысл дублировать это название в ответе?»
    Смысл в том, чтобы можно было удостовериться в том, что ассистент правильно и корректно расслышал запрос. Вы сами ниже не раз писали, что у ассистентов проблема с распознаванием речи.

    Пользуюсь Siri постоянно, так как никогда не включаю свой iPad Pro зажатием механической клавиши (ну или крайне редко). Вместо этого я вызываю Siri и говорю, какое приложение открыть. В итоге происходит не только бесконтактная разблокировка устройства, но и экран включается сразу на нужном приложении. Так же погоду узнаю по простой команде “Погода”, ни словом больше (зачем для этого ходить на профильные сайты?). Так же и время узнать, когда сонный с утра лежишь в кровати, и не хочешь тянуться к iPad и открывать глаза: “Привет Siri! Время”. “Привет, Siri! Какой заряд Apple Pencil”. Всё это простые но полезные и удобные для меня команды, которыми я пользуюсь постоянно.

    Возмущает, что версия Siri для русского языка уже чёрт знает сколько не может корректно обрабатывать числовые запросы в виде десятков тысяч, вроде “Двадцать тысяч”, “Тридцать тысяч” и т.д. В итоге выход пока один: с тупым ассистентом на тупом языке: “Двадцать пробел ноль ноль ноль рублей в долларах”. Только в этом случае запрос будет обработан корректно.

    Войди на сайт, чтобы ответить
    Ответить
  6. Yuri Severny avatar
    Yuri Severny 14 июля 2018
    0

    Для людей, потерявших зрение, это реальный выход из темноты. Вы вредничаете, потому что избалованы гаджетами – вам удобства подавай! Удивительно, но многим лень кнопку нажать…
    Рановато рассчитывать на “человеческое” восприятие голосовых помощников – реальный “ум” будет стоить дорого.

    Войди на сайт, чтобы ответить
    Ответить
  7. Twistgod avatar
    Twistgod 15 июля 2018
    0

    Может сюда заглядывают разработчики Яндекс, Алисы)
    Обращение к соотечествиникам, так как это пока самый комфортный голосовой помошник.

    Собственно просьба. Нарисуйте анимированое лицо девушки.

    Я не понимаю почему это ни гугл, ни эпл не делает. Ну, не могу я общаться с куском пластика, или с иконкой.

    Что бы было комфортно общаться, софт заключенный в пластик, должен иметь лицо с умеренной харизмой.

    Ребятушки из Яндекса увидьте этот комент:)

    Войди на сайт, чтобы ответить
    Ответить
Помни о правилах — если начал оффтопить, то не удивляйся потом.

Нашли орфографическую ошибку в новости?

Выделите ее мышью и нажмите Ctrl+Enter.