Иди и сотри: борьбу с запретным контентом в рунете роботизировали
Ответом на беспрецедентный рост деструктивного контента в рунете становятся роботизированные решения государства — технологии компьютерного зрения и искусственный интеллект со временем смогут отсечь большую часть запретного фото и видео. О начале функционирования одного из первых роботов-детективов — системы «Окулус» стало известно на прошлой неделе. «Известия» выяснили у экспертов, чего ждут от автоматизированных киберсыщиков, и узнали о планах развития системы.
«Окулус» открыла пасть
В Роскомнадзоре сообщили о старте работы системы автоматического поиска запрещенного фото и видео в рунете. Проект «Окулус» призван выявлять такой противоправный контент, как экстремистская тематика, призывы к массовым незаконным мероприятиям, суицид, наркореклама, пропаганда ЛГБТ и прочее.
О том, что проект «Окулус» уже некоторое время выполняет свои задачи по поиску запретного фото и видео в интернете, сообщил журналистам представитель Главного радиочастотного центра (ГРЧЦ) РКН. По словам источника, система была протестирована еще в декабре прошлого года, однако о результатах проверки не сообщалось.
«Система распознает изображения и символы, противоправные сцены и действия, анализирует текст в фото- и видеоматериалах», — уточнил представитель ФГУП ГРЧЦ принцип работы «Окулуса».
Проект «Окулус» использует технологию компьютерного зрения и способен проверять более 200 тыс. картинок в сутки (около трех секунд на обработку каждого изображения).
— До разработки системы «Окулус» специалисты ФГУП ГРЧЦ анализировали изображения и видео преимущественно вручную. В среднем операторы обрабатывали 106 изображений и 101 видео в день, — говорится в комментарии ФГУП ГРЧЦ «Известиям».
В организации отметили, что создание системы стало ответом на «лавинообразный рост вбросов по всем видам запрещенного контента».
«Всё это показывает важность детального анализа информационных атак в графическом контенте и возможностей противодействия им. Создание системы — это наш ответ на провокации и антироссийские действия со стороны иностранных ресурсов», — говорится в ответе на запрос «Известий».
Вопросы к мощности
На текущий момент о самой системе известно не так много, а три компании, занимающиеся вопросами кибербезопасности, воздержались от комментариев «Известиям» по работе системы «Окулус». По словам эксперта в области IT-безопасности, пожелавшего остаться неназванным, специалисты неохотно говорят на темы, связанные с госзаказами в отрасли. К тому же мало кому известно, по каким принципам и алгоритмам работает система и как организован поиск.
— Вызывает ряд вопросов относительно скромная мощность системы: 200 тыс. изображений в сутки — это очень мало. По сути, такой объем под силу обрабатывать штату сотрудников вручную. Для сравнения: дневная аудитория одной соцсети — десятки миллионов пользователей. Если даже 1% этой массы загрузит по одному фото в сутки, система захлебнется. А ведь речь лишь об одной соцсети, — пояснил собеседник.
По его словам, существуют бизнес-решения, способные определять и искать определенный тип контента (логотип, проприетарные фото и видео). Но основа такого механизма — жестко прописанный перечень того, что искать.
— А «запрещенный контент» — это аморфное понятие, существует масса вариаций такого содержимого, — добавил он.
Впрочем, ожидается дальнейшее развитие «Окулуса». В ФГУП ГРЧЦ «Известиям» сообщили, что в планах расширение функциональности системы.
«До 2025 года прорабатывается возможность добавления новых классов и типов нарушений, а также функции определения поз людей и их действий. Система будет выявлять запрещенные материалы на нескольких кадрах на видеофрагментах, в сложных рукописных текстах и рисованном контенте», — сообщили «Известиям» в ГРЧЦ.
Правовые штрихи
— Есть механизмы, основанные на искусственном интеллекте, а есть и те, что ищут контент по ключевым словам и фразам, — прокомментировал «Известиям» тенденцию привлечения ботов для борьбы с запретным контентом директор Ассоциации профессиональных пользователей соцсетей и мессенджеров Владимир Зыков — Если речь идет о технологии с применением ИИ, то такой системе нужно «скормить» тысячи и десятки тысяч материалов, на основе которых нейросети будут обучены.
По его мнению, скромная заявленная мощность системы — не проблема на данном этапе.
— Но есть другой важный момент. Сейчас в функциях РКН отсутствует возможность самостоятельного поиска запрещенных материалов. Они должны блокировать то, что им присылают, — уточнил специалист.
По его мнению, этот пробел нуждается в правовом урегулировании.
Болевые точки рунета
Интернет-пространство за последний год буквально погрязло в противоправном контенте, одним из следствий этого становится и всплеск преступлений «с использованием информационно-телекоммуникационных технологий». Одной из точек болезненного роста стала реклама наркотиков и рекрутинг в преступный бизнес, что отражается в полицейской статистике: только в среде выявленных наркопреступлений больше 62 тыс. совершены с помощью ИТТ.
С применением медиатехнологий совершено 2588 преступлений, связанных с изготовлением порнографических материалов; 493 факта призыва к экстремистской деятельности; 490 случаев призыва к террористической деятельности и оправдания и пропаганды таковой. Всего же в интернете в минувшем году было совершено свыше 381 тыс. тяжких и особо тяжких преступлений.
Эксперт Владимир Зыков также говорит о росте противоправного контента в соцсетях.
— Детское порно — это то, с чем нужно активно бороться. К сожалению, сейчас его визуально стало больше, чем раньше. Таким контентом пытаются торговать через ботов ТГ (администрация ТГ относительно оперативно все такие ресурсы начала банить, раньше с этим было хуже). Детское порно, и порно как таковое, автоматическим системам выявить довольно сложно. Думаю, им [«Окулус»] будет проще блокировать всё, что находит их система, несмотря на погрешности и ошибки. Так как те, кто это порно загрузил, скорее всего, блокировку оспаривать не будут: вся порнография в России запрещена. Об этом мало кто знает, но это факт, — резюмировал он.