Перейти к основному содержанию
Реклама
Прямой эфир
Мир
В Белоруссии зарегистрировали первый противоопухолевый клеточный продукт
Мир
В Аргентине задержан один из обвиняемых по делу о гибели солиста One Direction
Мир
Фермеры в Польше объявили протестную акцию у представительства ЕК
Мир
Уголовное дело по факту смерти баскетболиста Яниса Тиммы возбуждено в Латвии
Общество
В Мурманской области ожидаются морозы до –37 градусов
Мир
СМИ сообщили о росте импорта урана из России в Германию почти на 70%
Мир
Швеция направит в Финляндию корабль для расследования происшествия на Балтике
Мир
Республиканец Джонсон переизбран спикером палаты представителей конгресса США
Общество
Синоптики спрогнозировали гололедицу и небольшой снег в Москве 4 января
Мир
В Приднестровье начались веерные отключения электричества из-за нехватки энергии
Мир
Суд вынесет Трампу приговор по делу о подлоге документов 10 января
Мир
Лондон направит 2,6 тыс. военных и 730 единиц техники на учения НАТО
Мир
В Белоруссии запретили российскую гречку «Фермер»
Мир
Сийярто назвал жалким отказ Польши пригласить посла Венгрии на церемонию в ЕС
Культура
Юра Борисов и Марк Эйдельштейн номинированы на британскую кинопремию БАФТА
Спорт
Англичанин Литтлер в 17 лет стал самым молодым чемпионом мира по дартсу
Мир
Во Франции сообщили о желании 60% населения отправить Макрона в отставку
Мир
В Дании обновили королевский герб

В рейтинг качества ответов нейросетей попала новая разработка «Яндекса»

0
Фото: ИЗВЕСТИЯ/Дмитрий Коротаев
Озвучить текст
Выделить главное
Вкл
Выкл

Нейросеть YandexGPT Experimental вошла в новый рейтинг Llmarena, который оценивает качество ответов генеративных моделей на русском языке.

В топ также включили GPT-4o, LLaMA 3.1 и Claude 3,5 Sonnet.

«Яндекс» подтвердил, что ведет работу над новой более мощной версией своей базовой языковой модели.

Рейтинг оценивает, насколько хорошо модели отвечают на вопросы на русском языке. Пользователи могут задавать их на «Арене» и сравнивать, какая из нейросетей ответила лучше. Ответы выдаются без привязки к конкретной нейросети, чтобы пользователь мог беспристрастно оценить их качество. На основе собранных оценок авторы сервиса строят лидерборд моделей.

«Арену» запустили разработчики из российского ML-комьюнити. Принцип работы был взят у зарубежного сервиса LMSYS Chatbot Arena — одного из самых авторитетных бенчмарков на зарубежном рынке.

Читайте также
Прямой эфир