Российские разработчики представили две новые большие языковые модели
Группа «Т-Технологии» (в состав входит Т-Банк) открыла доступ к двум большим языковым моделям (LLM): T-Pro и обновленной T-Lite, созданным отечественными разработчиками. Об этом сообщили представители компании.
Как подчеркнули в «Т-Технологиях», данные модели превосходят все российские и зарубежные аналоги (на индустриальных бенчмарках).
«Когда мы начали развивать продукты на базе больших языковых моделей — например, копилотов для сотрудников и Вселенную AI-ассистентов — мы еще раз убедились, что существующие на рынке решения не отвечают нашим требованиям. Так мы начали развивать Gen-T — семейство специализированных языковых моделей. Убедившись в эффективности нашего решения, мы решили поделиться нашими моделями со всей индустрией и поменять подход к использованию LLM. Наш опыт смогут перенять другие компании, а использование LLM станет гораздо шире», — отметил директор по искусственному интеллекту Т-Банка Виктор Тарнавский.
Модели входят в Gen-T — семейство собственных специализированных языковых моделей Группы «Т-Технологии». Модели семейства предназначены для решения конкретных узкоспециализированных задач в отличие от универсальных решений, таких как ChatGPT.
Для создания моделей используется технология продолженного предобучения (Continual Pretraining). Это процесс, при котором уже обученную на больших объемах информации модель продолжают обучать на материалах, специфичных для определенной задачи или области, и адаптируют ее на русский язык. Модели T-Lite и T-Pro основаны на базе моделей семейства Qwen-2.5, но показывают более высокое качество на задачах русского языка, чем оригинальные модели.
Как заявили в «Т-Технологиях», представленные открытые модели дадут отечественным компаниям возможность вывести на качественно новый уровень свое технологическое развитие и придаст новый импульс экономике страны.