Вы, наверное, заметили, что после WWDC 2011 наш сайт практически не публикует слухов о сервисе распознавания голоса в iOS 5. Видите ли, до конференции таких слухов было полным-полно по той простой причине, что никто ничего не знал. Выступление Скотта Форсталла пролило свет на грядущую прошивку. Разработчики сразу же бросились изучать её бета-версии, журналисты — рассказывать о новых возможностях, пользователи — читать то, что написали журналисты и т.д. О распознавании голоса с тех пор вспомнили лишь однажды, когда хакер chronic опубликовал пару любопытных скриншотов на эту тему. А теперь давайте подумаем всерьёз, может ли распознавание голоса стать тем небольшим завершающим штрихом, который Apple приготовила напоследок? Не выйдет же Стив Джобс на сцену в сентябре со словами: “Об iOS 5 мы уже поговорили в июне, теперь давайте о чём-нибудь другом”. Купертиновцы, несомненно, оставили нечто интересное к моменту релиза. Например, тот самый сервис распознавания, о котором мы сегодня и поговорим.
В первом абзаце автор нарочно не упоминал Nuance. Видите ли, в начале 2010 года другая фирма, занимающаяся распознаванием голоса, стала частью Apple. Называется она Siri. Ещё до слияния с Apple компания успела выпустить бесплатное приложение Siri Assistant [iTunes link]. Об этой программе лучше всего расскажет видеоролик:
Итак, Siri Assistant представляет собой связку сервиса по распознаванию голоса и поисковой машины. Вы говорите: “Хочу сходить в местечко с японской кухней где-нибудь неподалёку”, и программа показывает японские рестораны рядом с вашим домом. Аналогичным образом можно узнать о погоде, заказать такси и т.п.
Переходим к самому главному. Сайт 9to5Mac раскопал скриншот (в заголовке статьи), на котором видны настройки сервиса под названием Assistant в iOS. Это не iOS 5, иначе “рычажки” выглядели бы по-другому. И это не тестовая сборка, побывавшая в руках chronic’а — там-то как раз рычажки смотрелись “по-новому”. Тем не менее, авторы сайта утверждают, что скриншот получен из надёжного источника. И, что ещё более важно, подкрепляют эти слова “собственной находкой в SDK”:
Новый сервис (интегрированный глубоко в систему, подобно Твиттеру) будет делать то же самое, что Siri Assistant, только в продвинутой форме. Кроме непосредственно голоса при поиске ответа на запрос будет использоваться дополнительная информация: геолокационные данные, контакты и музыка (!) пользователя. Простейший пример — вы говорите: “Хочу сходить на концерт с Лизой”. Assistant выбирает исполнителя в зависимости от ваших музыкальных предпочтений. Затем, основываясь на вашем местоположении, он ищет конкретный концерт и заказывает билеты. После чего сообщает об этом Лизе из вашего списка контактов.
Ясно, что такого рода сервис нужно долго совершенствовать. Для этих целей данные с вашего iOS-устройства будут в безопасной форме передаваться на серверы Apple. Отправка данных, само собой, будет производиться только с вашего разрешения. Помните, как при первом подключении устройства iTunes выдал запрос на сбор и анализ диагностической информации? Здесь будет примерно то же самое. Apple, в свою очередь, использует эти данные для улучшения сервиса.
9to5Mac утверждают, что Assistant может стать эксклюзивной возможностью для владельцев iPhone 5. История помнит характерный пример — видеосъёмку, доступную только на iPhone 3GS, хотя предыдущие iPhone тоже можно было ей оснастить.
Звучит слишком хорошо, чтобы быть правдой, не так ли? Упомянутый инсайдер подчёркивает, что сервис только-только вошёл в стадию тестирования. Появится он в iOS 5 или нет — большой вопрос. Но очень уж хочется, чтобы появился. [9to5mac]
23 комментариев
Форум →Ха-ха, я так и представил уже как вы, например, говорите “Ассистенту”: хочу послушать Джорджа Майкла (имея ввиду песни из медиатеки), а эта сволочь самовольно покупает вам недешевые билеты на его ближайший концерт в Европе + бронирует авиабилеты “туда и обратно” и отсылает в ваш офис напечатанное заявление на отгулы за свой счет на данный период )))
@Sirius961, спокойно, всё пучком; на слова “What the f*&k?” будет навешена команда безусловной отмены предыдущего действия.
@migmit, XD! А что, в первых версиях локализации Ассистента не будет? Жаль! XD
@Sirius961, Думаю без локализации будет веелее :)
@Sirius961, убил!!!! ))))))))))
@Sirius961, … первым постом!!! )))
@Sirius961, Фраза “За базаром следи, козёл!” приобретёт новый смысл.
“История помнит характерный пример — видеосъёмку, доступную только на iPhone 3GS, хотя предыдущие iPhone тоже можно было ей оснастить.”
Издеваетесь? Вы сами видели когда-нибудь это видео на 3G? Это трудно вообще назвать видео и Слава Богу, что Apple не додумались втулить туда видеосъемку! Это было бы на радость конкурентам, смеялись бы все долго.
@ibananov, +1
@ibananov, Согласен. Камера в 3G не была готова к видео.
@enshyou, Ну сейчас то любых мощностей хватает… Но делать это Фичей конкретного аппарата- глупость… Тихо конечна…
Хм, а сейчас на 4.3.х есть управление голосом? /айпад
@Go Vegas, управление голосом есть только на iPhone, начиная с 3GS.
@k214-raZor, ясно.
Неужели это будет популярно? Или хотя бы удобно? В любом мало-мальски шумном месте потребуется повторять по десять раз, пока устройство поймёт. Я уж молчу про качество распознавания голоса (особенно русского).
ЗЫ: нечто подобное (управление) реализовано в Galaxy S2. Годится на “поиграться” и просто для прикола. Проще/удобнее руками набить всё.
@zvukograf, попробуй ради интереса побаловаться глосовым поиском гугла – само по себе гугловское распознавание конечно не идеально, но шум и гам вокруг ему пофиг – у айфона, говорят, одна из самых совершенных систем шумоподавления.
@mani, да пользовался. Неудобно. =-) Ни на Галактике, ни на айфоне 4.
@zvukograf, Уже сейчас это удобно в 4-ке, в шумных местах не проблема, т.к. есть второй микрофон подавляющий шумы.
@zvukograf, absolutely agree! Вчера шел по очень шумной улице и через voice control в гарнитуру вызывал абонента. Если говоришь внятно и не быстро, то даже в самом шумном месте айфон поймет тебя с первого раза.)))
Вообще-то, в самом приложении на видео указано: “speech recognition by Nuance”, из чего понятно, что Siri занималась не распознаванием речи, а только разработкой поискового интерфейса, т.е. работала уже с готовым текстовым запросом.
А вы нафантазировали глупость:
” Видите ли, в начале 2010 года другая фирма, занимающаяся распознаванием голоса, стала частью Apple. Называется она Siri.”
Гугл поиск тока с фичами. Прикольно, но малополезно.
А что слышно про запрет перехода с приложения на сайт в новых требованиях публикации продукта?
Даа, было бы классно! Но оно в первой версии вряд ли будет идеально работать с русским языком ((.
Вот например на Windows Phone 7.5 уже интегрировали это, например когда приходит смска он сообщает типа: “Пришла смска от Вани Попова, Причитать или игнорировать?”, ты гришь “Прочитать” и он читает ее, в конце спрашивает “Ответить?”, ты говришь “Ответить” и диктуешь текст и говоришь “Отправить”… Даже понимает матершиные слова и меняет их на @#$%^ :)
Насчет поиска ресторана или ты просто говоришь “Найти ресторан суши неподaлеку” и все, он сам запускает Bing и показывает результаты.
Точность распознования на английском почти 99%, но на русском не понимает пока :((
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Что делать, если iPhone зависает во время входящих вызовов
Почему не создается резервная копия iPhone в iCloud
Почему не получается поделиться музыкой с AirPods другого человека
Как на iPhone временно отключить уведомления от конкретного приложения
Мышь с колесом прокрутки в macOS Sierra стала работать медленно, пропала плавная прокрутка
Можно ли заменить SSD и оперативную память в MacBook Pro 2016-2017
Как создавать напоминания, которые сработают одновременно на iPhone и Android-смартфоне
Почему на iPhone не получается передать сохраненный пароль по AirDrop