Перейти к основному содержанию
Реклама
Прямой эфир
Армия
Экипаж Су-34 уничтожил опорный пункт и живую силу ВСУ в курском приграничье
Происшествия
Над Волгоградской, Воронежской и Белгородской областями за ночь сбили пять БПЛА
Мир
Трамп пообещал Канаде вдвое снизить налоги при присоединении к США
Мир
Посол России в Гаване назвал приглашение Кубы в БРИКС признаком престижа страны
Мир
Премьер-министр Японии Исиба провел телефонный разговор с Зеленским
Мир
СМИ сообщили о намерениях ЦАХАЛ оставаться в Ливане дольше 60 дней
Мир
В Казахстан прибыли представители авиавластей Азербайджана и Azerbaijan Airlines
Политика
Лукашевич назвал обвинявших Лаврова в дезинформации недалекими
Мир
Спецборт МЧС РФ с пострадавшими при падении самолета россиянами вылетел из Актау
Армия
Минобороны показало учения танкистов в Краснодарском крае
Общество
Эксперты объяснили рост цен на препараты от диабета
Мир
В Азербайджане начался день траура по погибшим в авиакатастрофе в Казахстане
Мир
Трамп анонсировал назначение чиновника из Флориды послом США в Панаме
Общество
Синоптики спрогнозировали небольшие осадки и гололед в Москве 26 декабря
Общество
В Новый год жители России смогут увидеть Черную Луну
Общество
СК РФ возбудил уголовное дело по факту теракта в городе Льгов Курской области
Мир
Красный Крест готов содействовать в освобождении заложников из Газы
Мир
Пять палестинских журналистов убиты в результате удара Израиля по центру Газы

Новая разработка «Яндекса» ускорит обучение нейросетей

0
Фото: ИЗВЕСТИЯ/Константин Кокошкин
Озвучить текст
Выделить главное
Вкл
Выкл

«Яндекс» разработал библиотеку YaFSDP, предназначенную для ускорения обучения больших языковых моделей. Как сообщается в пресс-релизе компании, сервис уже доступен для разработчиков.

Библиотека подходит для обучения всех языковых моделей, включая модели с открытым исходным кодом. В компании также отметили, что она применима и для нейросетей, генерирующих изображения. YaFSDP позволяет сократить время обучения до 25% в зависимости от параметров и архитектуры модели. Кроме того, она позволяет снизить потребление ресурсов графических процессоров (GPU) до 20%.

Как пояснили в компании, одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Читайте также
Прямой эфир