Перейти к основному содержанию
Реклама
Прямой эфир
Мир
Дипмиссия КНР в Евросоюзе призвала НАТО прекратить вмешиваться в дела АТР
Мир
Такер Карлсон назвал Демократическую партию главной угрозой для безопасности США
Мир
Лавров обсудил эскалацию на Ближнем Востоке с послами арабских стран
Мир
Шор указал на спонсорство ЦИК Молдавии фондами из Европы и США
Мир
Армия Израиля заявила об уничтожении 150 объектов «Хезболлы» в Ливане
Мир
Причиной взрыва в японском аэропорту стал снаряд США времен Второй мировой
Мир
В США заявили о продвижении ВС РФ в Донбассе невиданными с 2022 года темпами
Мир
Глава МИД Армении призвал к осторожности в вопросе выхода из ОДКБ
Наука и техника
На ДЭФ презентовали концепцию первого в России водородного поезда
Мир
Шольц назвал конфликт на Украине причиной экономического кризиса в Германии
Мир
В Кишиневе люди вышли на улицы с одиночными пикетами против евроинтеграции
Мир
Мэр Ивано-Франковска призвал ужесточить украинизацию населения
Мир
Маск назвал наказанием возможную победу Харрис на выборах президента
Мир
Financial Times заподозрила Трампа в снижении умственных способностей
Политика
В Совфеде заявили о ведущей роли РФ в обеспечении цифрового суверенитета ЕАЭС
Общество
СК сообщил о гибели человека при пожаре в театре Екатеринбурга
Недвижимость
Краснодар обогнал Санкт-Петербург по объемам строительства жилья в России
Политика
Востоковед указал на противоречивую политику Эрдогана по Ближнему Востоку

Новая разработка «Яндекса» ускорит обучение нейросетей

0
Фото: ИЗВЕСТИЯ/Константин Кокошкин
Озвучить текст
Выделить главное
Вкл
Выкл

«Яндекс» разработал библиотеку YaFSDP, предназначенную для ускорения обучения больших языковых моделей. Как сообщается в пресс-релизе компании, сервис уже доступен для разработчиков.

Библиотека подходит для обучения всех языковых моделей, включая модели с открытым исходным кодом. В компании также отметили, что она применима и для нейросетей, генерирующих изображения. YaFSDP позволяет сократить время обучения до 25% в зависимости от параметров и архитектуры модели. Кроме того, она позволяет снизить потребление ресурсов графических процессоров (GPU) до 20%.

Как пояснили в компании, одна из сложностей в обучении больших языковых моделей — это недостаточная загрузка каналов коммуникации между графическими процессорами. YaFSDP это решает. Библиотека оптимизирует использование ресурсов GPU на всех этапах обучения: pre-training (предварительное), supervised fine-tuning (с учителем), alignment (выравнивание модели). Благодаря этому YaFSDP задействует ровно столько графической памяти, сколько нужно для обучения, при этом коммуникацию между GPU ничто не замедляет.

Читайте также
Прямой эфир