Задать слово: в России разработали «виртуального логопеда»
Российские ученые создали программное обеспечение, анализирующее правильность речи человека, рассказали «Известиям» разработчики проекта. Уже готова нейросеть, которая позволяет определить, как пользователь произносит фразы, а также возможность услышать собственную речь без нарушений. Сейчас создатели «виртуального логопеда» работают над мобильными приложениями и веб-версией продукта. Эксперты отмечают, что задумка ученых выглядит интересной, но на данном этапе она не способна полностью заменить специалистов, хотя и может помочь правильно произносить слова.
Как работает «виртуальный логопед»
В Московском физико-техническом институте создали «виртуального логопеда» — приложение, которое изучает речь и показывает, как правильно нужно произносить слова, рассказали «Известиям» авторы проекта.
— Записи пользователя конвертируются в спектрограммы (отображение звука на графике. — «Известия»), которые затем нарезаются на фреймы. Каждый такой элемент анализирует корректность произношения, на основе чего происходит вывод о возможных дефектах речи. Эта функциональность позволяет дать рекомендации по их дальнейшему устранению, а также подобрать подходящие уроки, — рассказала «Известиям» основатель проекта Мария Катышева.
Оценка произношения происходит похожим образом, как и диагностика, однако конечный алгоритм сравнивает запись речи пользователя во время выполнения задания с целевым результатом. В случае с «виртуальным логопедом» разработано специальное решение для генерации звука говорящего без каких-либо нарушений, отметили авторы проекта.
— Также мы разрабатываем виртуального ассистента, который сможет не только общаться с пользователем, но и помогать исправлять речь прямо время диалога. Для этого будут использованы большие языковые модели, нейронные сети для генерации голоса персонажа, а также уже указанные технологии по распознаванию нарушений, — сказала Мария Катышева.
Помимо нейросетевых технологий предусмотрены возможность поиска логопеда, упражнения по артикуляционной гимнастике и отслеживание собственного прогресса. По словам разработчиков, потенциальная аудитория — дети и взрослые от трех до 60 лет, которые хотят улучшить свою речь или исправить проблемы с произношением звуков, заиканием и другими нарушениями. При создании ПО авторы консультировались со специалистами в области логопедии.
Будет ли «виртуальный логопед» востребованным
Нарушения речи — очень сложная проблема, так как эти расстройства возникают на разных уровнях: от артикуляционного аппарата до речевых центров в мозге, отметили в пресс-службе сервиса дистанционного обучения медработников Vrachu.ru. Поэтому в последние 10 лет разработки цифровых методов корректировки очень востребованы.
— Цифровые методы диагностики и коррекции разные по сложности — от детских мобильных игр до интернет-порталов, объединяющих основанные на искусственном интеллекте автоматизированные методики и практикующих врачей-логопедов, — рассказали эксперты сервиса. — Также большинство мобильных приложений и стационарных программ имеет направленность конкретно на то или иное расстройство речи, которых насчитывается 11».
За рубежом есть достаточно много высокоэффективных решений, но локализованных российских методик высокого уровня пока не было, сообщили в сервисе. Там отметили, что объединение в одном проекте диагностического и коррекционного модуля — пока в мире редкость, так как это довольно сложно организовать.
Виртуальные системы позволяют пациентам, особенно живущим в удаленных регионах, в сельской местности и небольших городах, получить доступ к специализированной, а также более широкой помощи с точки зрения как качества, так и частоты ее получения, сказал генеральный директор сети клиник «Ниармедик» Виктор Дубровин.
— Для медицинских организаций это возможность снять легкие случаи с врача и перенаправить пациентов на тренажер. С помощью подобных приложений также повысится эффективность лечения за счет комбинированного подхода, когда врач оценивает и корректирует состояние пациента, а тренажер позволяет ему самостоятельно заниматься, — отметил специалист.
Использование искусственного интеллекта и машинного обучения могло бы помочь логопедам в плане накопления сведений об особенностях речевого развития детей и произношения взрослых, чтобы они смогли на анализе больших данных делать выводы о характере нарушений и их особенностях в различных регионах страны. Кроме того, полезно отслеживать прогресс коррекционных занятий, утверждает кандидат педагогических наук, доцент кафедры логопедии Московского городского педагогического университета Ольга Величенкова.
— Что касается постановки диагноза, вынесения суждения о состоянии речевой функции, то здесь требуется не только анализ звучащей речи. Логопеду приходится анализировать анамнестические данные, собирать их, беседовать с родителями, если это дети, подчеркнула специалист.
Также необходимо проводить обследование у других специалистов для принятия окончательного решения. Поэтому использование ИИ может способствовать улучшению диагностики, но не сможет заменить логопеда, во всяком случае на данном этапе, сказала она.
— Виртуальный логопед может помочь взрослым, которые хотят подготовится к публичным выступления, а также подросткам и студентам — тем, кто хочет улучшить звучание своей речи, устранить дефекты звукопроизношения, научиться правильной дикции, — отметила учитель-логопед ГБОУ «Школа Новокосино» Ирина Черноусова.
Приложение также подойдет детям в возрасте от пяти-шести лет, которым логопеды уже сформировали правильную артикуляцию, «поставили звук» и на следующем этапе под контролем родителей можно использовать софт в домашних условиях для автоматизации звуков в речи ребенка, полагает она.
Работа логопеда очень сложна, и, если ученые действительно смогут подобрать такие алгоритмы, которые будут качественно анализировать речь, это облегчит работу людям. Но пока веры в то, что нейросетям удастся заменить специалистов, нет, резюмировала президент Гильдии логопедов и дефектологов Юлия Покровская.