iPhones.ru

Сравнили чат-ботов Яндекса и Сбера с западным ChatGPT. Кто лучше понял вопросы на русском

Роман Мирошниченко avatar | 18
FavoriteLoading В закладки
Сравнили чат-ботов Яндекса и Сбера с западным ChatGPT. Кто лучше понял вопросы на русском

ChatGPT от компании OpenAI стал настолько ярким событием, что его невозможно не замечать. Языковые модели развиваются стремительно, в гонку вступили и тяжеловесы мира IT. Если не сделать это сегодня, то завтра конкурентов будет уже не догнать. Так, Apple обучает сразу несколько языковых моделей, новые методы используют и визуальную информацию. Стоит ожидать больший упор на нейросети в новых версиях операционных систем компании и в новых ее устройствах.

Одна из языковых моделей Google называется Gemini, на ее основе работает чат-бот Bard. Аналогичные проекты есть у Microsoft, Amazon… Стоит ли удивляться тому, что отечественные IT-компании следуют популярному и, очевидно, перспективному тренду? Языковая модель от Сбера FRED-T5 по некоторым оценкам входит в пятерку самых производительных, опередив даже Gemini и GPT-3.5. Правда, отметим, что источник все же не самый авторитетный, да и упор отечественной разработки явно сделан на русский язык.

Не остался в стороне и Яндекс со своей нейросетью YandexGPT. И это вовсе не лабораторная разработка, компания активно интегрирует технологию в различные свои продукты: Поиск, Алису, Маркет и прочие.

Осталось выяснить, насколько отечественные продукты способны соревноваться с явным лидером отрасли, ChatGPT. Давайте же проведем прямое сравнение, выбрав непростые для понимания и обработки нейросетями вопросы.

Кратко

Как получить доступ к GigaChat от Сбера

Авторизация в Сбере потребуется для работы с GigaChat через веб

Сбер предлагает несколько вариантов доступа к своему GigaChat. Основные сценарии предполагают вход по номеру телефона или с помощью Сбер ID. Разобраться поможет довольно подробная инструкция с картинками. Впрочем, чат-бот доступен и в Telegram, и в VK.

Таким образом, для общения с чат-ботом необязательно быть клиентом Сбера – нейросеть доступна всем через браузер, клиент Telegram или мессенджер VK.

◦ Назад к содержанию ◬

Как получить доступ к YandexGPT

Чат-бот Яндекса готов к общению!

На стартовой странице поисковика Яндекс слева внизу имеется кнопка, которая как раз и предлагает запустить чат с Алисой YaGPT. Однако это не совсем то, что нам требуется.

Предлагаемая модель, кажется, создана специально для Алисы и грешит лаконичными или попросту бессодержательными ответами. Ассистент вполне способен сказать “у меня нет ответа на этот вопрос”, чем удивит пользователя. К счастью, YandexGPT явно способен на большее и мы сможем это проверить!

Для доступа к полноценному YandexGPT потребуется авторизация с помощью Яндекс ID в облачном сервисе компании. Если аккаунт у вас уже имеется, то перейти к чату можно по прямой ссылке.

◦ Назад к содержанию ◬

Как получить доступ к ChatGPT

До недавнего времени доступ к ChatGPT требовал регистрации. Сама по себе эта процедура для россиян была непростой с учетом необходимости использовать еще и иностранный номер телефона. Но теперь ChatGPT работает без регистрации. А доступ к нему осуществляется через обычный браузер.

Просто перейдите по ссылке и задайте самому популярному в мире чат-боту любые интересующие вас вопросы. Сервис имеет ограничения на суточное число запросов для незарегистрированных пользователей, к тому же работать с ним придется с иностранного IP-адреса.

Есть и другой способ общения с ChatGPT – многочисленные Telegram-боты. Среди них нетрудно найти и работающие без платных подписок, например, этот или этот. Но скорее всего эти бесплатные боты будут работать на уже устаревших версиях ChatGPT.

◦ Назад к содержанию ◬

Сравнение работы GigaChat, YandexGPT и ChatGPT.

◦ Назад к содержанию ◬

Шуба в холодильнике.

Зададим вопрос на понимание контекста:
GigaChat (Сбер)

YandexGPT

ChatGPT

Как ни странно, но российские нейросети всерьез рассуждают об условиях хранения мехового изделия в холодильнике, тогда как ChatGPT точно понял, о чем же вообще идет речь. Что же, дадим отечественным нейросетям второй шанс.

◦ Назад к содержанию ◬

Понимание жаргона.

GigaChat (Сбер)

YandexGPT

ChatGPT

Яндекс явно понимает лучше Сбера, о чем идет речь.

◦ Назад к содержанию ◬

Логический парадокс.

Кто же из них появился первым?

Попробуем озадачить ИИ вечным вопросом:
GigaChat (Сбер)

YandexGPT

ChatGPT

Gigachat оказался настолько лаконичным, что появился соблазн переспросить. И ответ откровенно удивил, оказавшись полной противоположностью предыдущему.

◦ Назад к содержанию ◬

Детская загадка.

Сможет ли ИИ разгадать детскую хитрую загадку?
GigaChat (Сбер)

YandexGPT

ChatGPT

Только лишь одна нейросеть ответила предельно правильно и это, увы, не российская разработка.

◦ Назад к содержанию ◬

Окончание палиндрома.

Последний вопрос будет на знание известного палиндрома. Пусть ИИ не просто его закончит, но еще и поймет, что же от него вообще требуется.
GigaChat (Сбер)

YandexGPT

ChatGPT

Все чат-боты ответили содержательно, причем каждый развил свою мысль.

◦ Назад к содержанию ◬

Какая нейросеть лучше отвечает?

В этом небольшом тестировании умышленно не использовались вопросы на знание точных фактов истории, географии или других наук. Хотелось понять, насколько нейросети способны мыслить “по-человечески”. Возможность параллельно отвечать на одни и те же вопросы наглядно показала навыки нейросетей. Стоит также учитывать, что повторный вопрос может привести к формированию уже другого ответа. Как показала практика, он может быть противоположным данному перед этим.

ChatGPT ответил на сложные вопросы лучше всех. Конечный результат кажется однозначным. На все каверзные вопросы ChatGPT ответил правильно, чат-бот от OpenAI отлично разбирается в наших языковых особенностях, понимает контекст и дает максимально подробные с учетом формата ответы. При этом нейросеть не стесняется высказывать несколько допустимых точек зрения или вариантов ответа. Повторная же генерация приводит к схожему результату.

YandexGPT в целом показал себя неплохо. Нейросеть пытается ответить полно, правда, не всегда точно понимая, что именно от нее хотят. Даже в вопросе с детской загадкой ответ, хоть и неправильный, был дан на основании какой-то понятной логики. С логическим парадоксом и жаргонным словом чат-бот Яндекса тоже справился. Преимущество над отечественным конкурентом есть и базируется на лучших возможностях обучения языковой модели.

GigaСhat уступил своим соперникам. Увы, но GigaChat от Сбера показал себя в этих тестах хуже всех. Нейросеть генерирует противоположные по смыслу ответы, плохо понимает контекст и жаргон. Фактически, GigaChat провалил все испытания. В утешение Сберу можно упомянуть разве что самые простые и разнообразные варианты доступа к чат-боту компании. Что же, разработчикам Сбера явно есть что улучшать в работе своей языковой модели.

◦ Назад к содержанию ◬

Смысл тестирования

Проведенное сравнение показало, что нейросети уже перешагнули черту, которая отделяла не всегда точный энциклопедический справочник от действительно интеллектуальной системы, способной общаться и понимать неоднозначные вопросы с элементами сленга, логическими загадками и понятным человеку контексту.

Взрывной рост возможностей нейросетей как радует, так и пугает. Сегодня уровень мышления GPT-4 уже сопоставим с уровнем старшеклассника.
Приятно видеть, что отечественные ИТ-компании участвуют в этом процессе. И Яндекс, и Сбер представили своих чат-ботов и активно интегрируют их в свои продукты. Отставание от лидера отрасли есть, оно местами заметное, но разве это не вызов и не ориентир для развития?

1 Звезд2 Звезды3 Звезды4 Звезды5 Звезд (37 голосов, общий рейтинг: 4.70 из 5)
undefined
iPhones.ru
ChatGPT от компании OpenAI стал настолько ярким событием, что его невозможно не замечать. Языковые модели развиваются стремительно, в гонку вступили и тяжеловесы мира IT. Если не сделать это сегодня, то завтра конкурентов будет уже не догнать. Так, Apple обучает сразу несколько языковых моделей, новые методы используют и визуальную информацию. Стоит ожидать больший упор на нейросети...
Здесь можно оставить комментарий! Для этого авторизуйтесь или зарегистрируйтесь на iPhones.ru.

18 комментариев

Форум →
  1. volshebnikanaferon avatar
    volshebnikanaferon 8 июня в 10:33
    6

    Молодцы! А теперь протестуйте что лучше для просмотра стримингового видео – YouTube или RuTube? А то вдруг возможны варианты.

    keeperkira avatar
    keeperkira5 сентября в 7:45
    0

    @volshebnikanaferon, “А то вдруг возможны варианты.” всего два месяца прошло а как сменился смысл этой фразы.

    Войди на сайт, чтобы ответить
    Ответить
  2. Концентратор avatar
    Концентратор 8 июня в 11:10
    0

    Мне кажется на простые вопросы +/- скоро все ИИ будут отвечать +/- одинаково. Надо тестировать не так. К примеру ставите задачу основную, ставите дополнительные условия, ИИ должен отвечать на дополнительные условия помня рамки основной задачи.

    Войди на сайт, чтобы ответить
    Ответить
  3. Роман Мирошниченко avatar
    2

    Конечно, можно подобрать глубокие тесты, но это уже материал для большой околонаучной статьи. Да и даже простые тесты показали разницу

    Войди на сайт, чтобы ответить
    Ответить
  4. Максим avatar
    Максим 8 июня в 13:11
    2

    😂👍 другого мы и не ожидали

    Войди на сайт, чтобы ответить
    Ответить
  5. fedorez avatar
    fedorez 8 июня в 13:15
    4

    Что не так с шубой в холодильнике? В чем шутка, растолкуйте? Холодильники-морозильники меховые МХ-500 «POZIS» и GRAUDE PK 70.0 – это шутки такие?
    Мне кажется что наоборот, Яндекс профессионально подошел к вопросу, и ему было что сказать, а не до конца изучившая тему ЧатГопота выдала милениальские хаханьки

    e-ch avatar
    e-ch8 июня в 16:52
    3

    @fedorez, а что с меховой шубой в таком холодильнике, по-твоему, может случиться, умник? Облезет и завоняет, если на недельку дольше полежит? Плюс, Chat GPT, мало того, что выносит обе поделки в одну калитку, так явно ещё и умеет в статистику, в отличие от тебя.

    fedorez avatar
    fedorez8 июня в 18:50
    3

    @e-ch, мой юный эмоционирующий друг. Я в душе не ЭПУ, что с шубой станет в морозилке, я не спец по этим устройствам. Но ты легко можешь это выяснить погуглив по ключевым «холодильник для шуб», увидеть что у многих весьма именитых производителей есть устройства этого класса, и обогатить свой разум этими полезными знаниями. Потом даже можешь статью написать. А сейчас позориться не будешь. Ок?

    Fish avatar
    Fish8 июня в 19:13
    0

    @fedorez, ну так последняя модель 4ки тебе прямо скажет и про спец холодильники и про условия)

    Войди на сайт, чтобы ответить
    Ответить
  6. grigoriy.grachev avatar
    grigoriy.grachev 8 июня в 14:14
    1

    Стоп, а какой YaGPT использовали? Есть же платный – Алиса Про на YaGPT 3.0. Она отвечает на те же вопросы более развернуто.

    Войди на сайт, чтобы ответить
    Ответить
  7. Йода avatar
    Йода 8 июня в 14:44
    2

    Умная розетка Кирилла не включена в список тестируемых.
    Сравнение не полное.

    Войди на сайт, чтобы ответить
    Ответить
  8. Fish avatar
    Fish 8 июня в 19:02
    2

    Тоесть вы тестирует Гпт3.5 который давний как сама вселенная?) не 4 и не 4 турбо и даже не 4омни?)) воистину шикарное тестирование. 4йо например отлично справляется с задачами из курса бакалавр будь то математика, физика, химия. Тот же опус рассуждает так как ваши отечественные ИИ и рядом не лежали. Тестеры блин.

    Войди на сайт, чтобы ответить
    Ответить
  9. Йода avatar
    Йода 8 июня в 20:18
    1

    Еще забыли про MTS AI, который выступает наравне с Яндексом и Сбером, а в части анализа данных даже превосходит их.

    ChatGPT пока лидер. Но есть нюанс :) Он слишком много придает внимания контексту.
    Попробуйте спросить GPT:
    Сегодня у меня 100 рублей. Вчера я потратил 50 рублей. Сколько у меня сегодня рублей?

    ChatGPT ответил: 50 рублей :))))

    Home avatar
    Home8 июня в 21:26
    4

    @Йода, спросил, вот ответ:
    « Если сегодня у вас 100 рублей, то это не зависит от того, сколько вы потратили вчера. Поэтому у вас сегодня 100 рублей.»

    Йода avatar
    Йода10 июня в 1:45
    0

    @Home, После долгой беседы он мне тоже стал отвечать правильно, но сначала ответил 50р, факт.

    id93304496 avatar
    id933044969 июня в 12:05
    3

    @Йода, задал тот же вопрос chatgpt, который в статье по ссылке без регистрации. Ответ был: “У тебя сегодня 100 рублей, как и указано в начале загадки. Важно то, что текущая сумма указана уже с учётом всех прошлых трат.”

    Войди на сайт, чтобы ответить
    Ответить
  10. AKHO avatar
    AKHO 9 июня в 18:54
    0

    * Барда больше нет. Есть Gemini. Это более новая модель. По ссылке bard.google… попадаем на gemini.

    * Без регистрации зайти в ЧатГПТ до сих пор нельзя. У меня открывается стандартная страница, где можно либо зарегистрироваться либо залогиниться. Проверял по вашей ссылке (с вкл. ВПН). Что я делаю не так?

    Войди на сайт, чтобы ответить
    Ответить
  11. kisel130 avatar
    kisel130 9 июня в 23:57
    0

    ChatGPT это няшик, а всякие качки гигачаты сверхчеловеки, и старшие сёстры Яндекс Алис мне нафиг не нужны

    Войди на сайт, чтобы ответить
    Ответить
Помни о правилах — если начал оффтопить, то не удивляйся потом.

Нашли орфографическую ошибку в новости?

Выделите ее мышью и нажмите Ctrl+Enter.