Группа исследователей Apple представила ReALM (Reference Resolution as Language Modeling) — новую ИИ-модель, которая направлена на радикальное улучшение понимания у голосовых помощников и для повышения реагирования на команды.
Компания говорит, что эта большая языковая модель позволяет расшифровать «неоднозначные ссылки» в экранных объектах, а также справляется с пониманием разговорного и фонового контекста. ReALM может привести к более интуитивному и естественному взаимодействию с устройствами.
Под неоднозначными ссылками понимаются используемые юзерами местоимения и подобные элементы речи в ходе разговора.
Для голосовых ассистентов эта возможность исторически была серьезной проблемой. Система ReALM от Apple пытается её решить, превращая сложный процесс интерпретации ссылок в задачу языкового моделирования.
ReALM реконструирует визуальный макет экрана, используя текстовые представления, включая анализ экранных объектов и их местоположений для создания текстового формата, отражающего содержимое и структуру экрана. Исследователи Apple обнаружили, что благодаря этой стратегии и специальной тонкой настройкой языковых моделей значительно превосходит традиционные методы, включая те, что применяются в ChatGPT.
Новая ИИ-система от Apple может позволить эффективнее взаимодействовать с цифровыми помощниками, опираясь на то, что в данный момент отображается на экране, то есть не надо будет говорить какие-то уточняющие вещи. Это может сделать цифровых ассистентов эффективнее в различных ситуациях. Например, помогая водителям ориентироваться в медиасистемах авто во время вождения или помогая пользователям с ограниченными возможностями, предоставляя более простые и точные средства непрямого взаимодействия. [MacRumors]
12 комментариев
Форум →На бумаге круто, а потом:
-Реалм, выключи телевизор в спальне
-Еще работаю над этим…
Як сири превзошла всех голосовых помощников? :)))
А как они планируют это продемонстрировать? На словах я тоже могу назвать себя опытным разработчиком нейросетей и языковых моделей (но это не так). В конце концов, есть ChatGPT и другие инструменты с разными ламами и альпаками.
Может конечно превзойти, а может не превзойти)
У Apple есть неоспоримое преимущество
Если они выкатят новую улучшенную Сири на все свои устройства а их сотни млн то станут лидерами рынка
Если это будет еще и бесплатно
Хотя скорей всего ИИ будет по очередной подписке
Яндекс очень сильно отстает – хотя ей никто не мешает ко всем колонкам подлечить ИИ уже сейчас
@Андрей Иванов, включаешь в приложении Дом с Алисой режим бета – имеешь колонку с Я-жопоте.
@tylerDurden, и что прям как в чат гпт можно подолгу общаться на разные темы?
То есть, никого не смущает, что анонсировали выпуск chatGPT 5 уже этим летом, а продолжают сравнивать с chatGPT 4 :)
@Йода, типа странно, что не сравнивают с гпт5 ?
@tylerDurden, Странно, что вообще сравнивают со старым продуктом, а не рассказывают о достоинствах независимо от других продуктов.
@Йода, Ну не знаю… Как по мне – принятие в контекст того, что отображено на экране – это нечто новое, и кажется полезное… Ну а какая могла бы быть еще революционность.. генеративный ии уж какой есть.. сейчас вопрос больше в новых контекстах его применения.
такое ощущение к сожалению что апл уже ни чего не может предоставить чтобы что то превзойти
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Почему Apple Watch неправильно измеряют пульс
Пропадает интернет на iPhone, что делать?
Как в Safari на iPhone упорядочивать вкладки и находить нужную
Как откатиться на iOS 15 после установки iOS 16 beta
Почему некоторые приложения на iPhone постоянно требуют обновления
Как на iPhone с Face ID включить отображение заряда в процентах. Собрали все способы
Как в macOS Ventura посмотреть конфигурацию Mac. Ищем Отчет о системе
Можно ли убрать царапины с рамки iPhone