Реклама

Прямой эфир

В Белоруссии зарегистрировали первый противоопухолевый клеточный продукт

В Аргентине задержан один из обвиняемых по делу о гибели солиста One Direction

Фермеры в Польше объявили протестную акцию у представительства ЕК

Уголовное дело по факту смерти баскетболиста Яниса Тиммы возбуждено в Латвии

Общество

В Мурманской области ожидаются морозы до –37 градусов

СМИ сообщили о росте импорта урана из России в Германию почти на 70%

Швеция направит в Финляндию корабль для расследования происшествия на Балтике

Республиканец Джонсон переизбран спикером палаты представителей конгресса США

Общество

Синоптики спрогнозировали гололедицу и небольшой снег в Москве 4 января

В Приднестровье начались веерные отключения электричества из-за нехватки энергии

Суд вынесет Трампу приговор по делу о подлоге документов 10 января

Лондон направит 2,6 тыс. военных и 730 единиц техники на учения НАТО

В Белоруссии запретили российскую гречку «Фермер»

Сийярто назвал жалким отказ Польши пригласить посла Венгрии на церемонию в ЕС

Культура

Юра Борисов и Марк Эйдельштейн номинированы на британскую кинопремию БАФТА

Англичанин Литтлер в 17 лет стал самым молодым чемпионом мира по дартсу

Во Франции сообщили о желании 60% населения отправить Макрона в отставку

В Дании обновили королевский герб

В рейтинг качества ответов нейросетей попала новая разработка «Яндекса»

30 июля 2024, 19:55

0

Нейросеть

Фото: ИЗВЕСТИЯ/Дмитрий Коротаев

dzen

Следите за нашими новостями в удобном формате

fos

Есть новость? Присылайте!

Озвучить текст

Выделить главное

Вкл

Выкл

Нейросеть YandexGPT Experimental вошла в новый рейтинг Llmarena, который оценивает качество ответов генеративных моделей на русском языке.

В топ также включили GPT-4o, LLaMA 3.1 и Claude 3,5 Sonnet.

«Яндекс» подтвердил, что ведет работу над новой более мощной версией своей базовой языковой модели.

Рейтинг оценивает, насколько хорошо модели отвечают на вопросы на русском языке. Пользователи могут задавать их на «Арене» и сравнивать, какая из нейросетей ответила лучше. Ответы выдаются без привязки к конкретной нейросети, чтобы пользователь мог беспристрастно оценить их качество. На основе собранных оценок авторы сервиса строят лидерборд моделей.

«Арену» запустили разработчики из российского ML-комьюнити. Принцип работы был взят у зарубежного сервиса LMSYS Chatbot Arena — одного из самых авторитетных бенчмарков на зарубежном рынке.

Поделиться:

Читайте также

Прямой эфир

Подпишитесь и получайте новости первыми

ВКонтакте

Меню

Авторское право на систему визуализации содержимого портала iz.promo.vg, а также на исходные данные, включая тексты, фотографии, аудио- и видеоматериалы, графические изображения, иные произведения и товарные знаки принадлежит ООО «МИЦ «Известия». Указанная информация охраняется в соответствии с законодательством РФ и международными соглашениями.

Частичное цитирование возможно только при условии гиперссылки на iz.promo.vg.

Сайт функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

Ответственность за содержание любых рекламных материалов, размещенных на портале, несет рекламодатель.

Новости, аналитика, прогнозы и другие материалы, представленные на данном сайте, не являются офертой или рекомендацией к покупке или продаже каких-либо активов.

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций. Свидетельства о регистрации ЭЛ №ФС 77 - 76208 от 8 июля 2019 года , ЭЛ №ФС 77 - 72003 от 26 декабря 2017 года

Все права защищены © ООО «МИЦ «Известия», 2025