Иди и сотри: борьбу с запретным контентом в рунете роботизировали

Ответом на беспрецедентный рост деструктивного контента в рунете становятся роботизированные решения государства — технологии компьютерного зрения и искусственный интеллект со временем смогут отсечь большую часть запретного фото и видео. О начале функционирования одного из первых роботов-детективов — системы «Окулус» стало известно на прошлой неделе. «Известия» выяснили у экспертов, чего ждут от автоматизированных киберсыщиков, и узнали о планах развития системы.

Грибной канал: в интернете распространяют всё более опасные наркотики

В полиции рассказали о незаконной торговле на маркетплейсах

«Окулус» открыла пасть

В Роскомнадзоре сообщили о старте работы системы автоматического поиска запрещенного фото и видео в рунете. Проект «Окулус» призван выявлять такой противоправный контент, как экстремистская тематика, призывы к массовым незаконным мероприятиям, суицид, наркореклама, пропаганда ЛГБТ и прочее.

О том, что проект «Окулус» уже некоторое время выполняет свои задачи по поиску запретного фото и видео в интернете, сообщил журналистам представитель Главного радиочастотного центра (ГРЧЦ) РКН. По словам источника, система была протестирована еще в декабре прошлого года, однако о результатах проверки не сообщалось.

«Система распознает изображения и символы, противоправные сцены и действия, анализирует текст в фото- и видеоматериалах», — уточнил представитель ФГУП ГРЧЦ принцип работы «Окулуса».

Фото: Global Look Press/dpa/Paul Zinken

Проект «Окулус» использует технологию компьютерного зрения и способен проверять более 200 тыс. картинок в сутки (около трех секунд на обработку каждого изображения).

— До разработки системы «Окулус» специалисты ФГУП ГРЧЦ анализировали изображения и видео преимущественно вручную. В среднем операторы обрабатывали 106 изображений и 101 видео в день, — говорится в комментарии ФГУП ГРЧЦ «Известиям».

Справка «Известий»

На основании требований Генпрокуратуры РФ в 2022 году было удалено и заблокировано 102 627 интернет-ресурсов, которые содержат недостоверную информацию (в том числе о ходе СВО ВС РФ на территории Украины). Для сравнения: в 2021 году таких ресурсов было 7203, в 2020-м — 1525, в 2019 году — 311.

Наиболее применяемым инструментом в руках антироссийских источников стал визуальный контент, который способен оказать большее впечатление на эмоции пользователей.

По данным ФГУП ГРЧЦ

В организации отметили, что создание системы стало ответом на «лавинообразный рост вбросов по всем видам запрещенного контента».

Фото: Getty Images/Westend61

Правды подобие: школьников хотят научить распознавать фейки и русофобию

Минпросвещения просят разработать методики для повышения информационной грамотности детей

«Всё это показывает важность детального анализа информационных атак в графическом контенте и возможностей противодействия им. Создание системы — это наш ответ на провокации и антироссийские действия со стороны иностранных ресурсов», — говорится в ответе на запрос «Известий».

Вопросы к мощности

На текущий момент о самой системе известно не так много, а три компании, занимающиеся вопросами кибербезопасности, воздержались от комментариев «Известиям» по работе системы «Окулус». По словам эксперта в области IT-безопасности, пожелавшего остаться неназванным, специалисты неохотно говорят на темы, связанные с госзаказами в отрасли. К тому же мало кому известно, по каким принципам и алгоритмам работает система и как организован поиск.

— Вызывает ряд вопросов относительно скромная мощность системы: 200 тыс. изображений в сутки — это очень мало. По сути, такой объем под силу обрабатывать штату сотрудников вручную. Для сравнения: дневная аудитория одной соцсети — десятки миллионов пользователей. Если даже 1% этой массы загрузит по одному фото в сутки, система захлебнется. А ведь речь лишь об одной соцсети, — пояснил собеседник.

По его словам, существуют бизнес-решения, способные определять и искать определенный тип контента (логотип, проприетарные фото и видео). Но основа такого механизма — жестко прописанный перечень того, что искать.

Фото: Global Look Press/Jochen Tack

— А «запрещенный контент» — это аморфное понятие, существует масса вариаций такого содержимого, — добавил он.

Есть столько книг: в прокуратуру пожаловались на пропаганду ЛГБТ

Ведомство попросили проверить, как онлайн-магазины соблюдают закон

Впрочем, ожидается дальнейшее развитие «Окулуса». В ФГУП ГРЧЦ «Известиям» сообщили, что в планах расширение функциональности системы.

«До 2025 года прорабатывается возможность добавления новых классов и типов нарушений, а также функции определения поз людей и их действий. Система будет выявлять запрещенные материалы на нескольких кадрах на видеофрагментах, в сложных рукописных текстах и рисованном контенте», — сообщили «Известиям» в ГРЧЦ.

Правовые штрихи

— Есть механизмы, основанные на искусственном интеллекте, а есть и те, что ищут контент по ключевым словам и фразам, — прокомментировал «Известиям» тенденцию привлечения ботов для борьбы с запретным контентом директор Ассоциации профессиональных пользователей соцсетей и мессенджеров Владимир Зыков — Если речь идет о технологии с применением ИИ, то такой системе нужно «скормить» тысячи и десятки тысяч материалов, на основе которых нейросети будут обучены.

По его мнению, скромная заявленная мощность системы — не проблема на данном этапе.

Фото: РИА Новости/Виктор Толочко

— Но есть другой важный момент. Сейчас в функциях РКН отсутствует возможность самостоятельного поиска запрещенных материалов. Они должны блокировать то, что им присылают, — уточнил специалист.

Трудное устройство: мошенники придумали хитрую схему обмана веб-дизайнеров

Как создатели логотипов и лендингов становятся жертвами липового онлайн-трудоустройства

По его мнению, этот пробел нуждается в правовом урегулировании.

Болевые точки рунета

Интернет-пространство за последний год буквально погрязло в противоправном контенте, одним из следствий этого становится и всплеск преступлений «с использованием информационно-телекоммуникационных технологий». Одной из точек болезненного роста стала реклама наркотиков и рекрутинг в преступный бизнес, что отражается в полицейской статистике: только в среде выявленных наркопреступлений больше 62 тыс. совершены с помощью ИТТ.

С применением медиатехнологий совершено 2588 преступлений, связанных с изготовлением порнографических материалов; 493 факта призыва к экстремистской деятельности; 490 случаев призыва к террористической деятельности и оправдания и пропаганды таковой. Всего же в интернете в минувшем году было совершено свыше 381 тыс. тяжких и особо тяжких преступлений.

Фото: Getty Images/mantinov

Эксперт Владимир Зыков также говорит о росте противоправного контента в соцсетях.

— Детское порно — это то, с чем нужно активно бороться. К сожалению, сейчас его визуально стало больше, чем раньше. Таким контентом пытаются торговать через ботов ТГ (администрация ТГ относительно оперативно все такие ресурсы начала банить, раньше с этим было хуже). Детское порно, и порно как таковое, автоматическим системам выявить довольно сложно. Думаю, им [«Окулус»] будет проще блокировать всё, что находит их система, несмотря на погрешности и ошибки. Так как те, кто это порно загрузил, скорее всего, блокировку оспаривать не будут: вся порнография в России запрещена. Об этом мало кто знает, но это факт, — резюмировал он.