Тексты без даты: у журналистов есть 30 лет, пока их не заменит ИИ
Искусственный интеллект уже довольно неплохо пишет новости. Но до создания длинных осмысленных текстов ему далеко. К тому же компаниям не слишком интересно вкладываться в уничтожение второй древнейшей профессии. О перспективах роботов-журналистов «Известия» поговорили с основателем ABBYY Давидом Яном и научным сотрудником DeepMind Алексом Грейвсом на форуме Global Innovation Forum 2019 в Ереване.
Новости о погоде и пробках, заметки по квартальным отчетам журналисты давно пишут по шаблонам. Просто меняют названия улиц или компаний и дописывают новые цифры. Чтобы освободить их от механической работы, уже несколько компаний, в том числе российских, используют искусственный интеллект.
Разница между автоматизацией и контролем
Научный сотрудник британской компании DeepMind Алекс Грейвс признает, что машины будут заниматься новостями всё больше и больше. Но то, что требует от человека креативности, не будет отдано алгоритмам. По крайней мере в ближайшее время, сказал он «Известиям» на форуме Global Innovation Forum 2019 в Ереване. Пусть это его мнение не слишком соответствует тому, что принадлежащая Google компания DeepMind прославилась созданием нейросети, обыгравшей чемпиона мира по го.
Ученый не считает, что технологический прогресс лишит людей работы. Грейвс напомнил, как в XVIII–XIX веках промышленная революция уничтожила одни рабочие места и создала другие. К тому же в креативных индустриях человек всё равно будет контролировать процесс.
«Есть разница между автоматизацией и сохранением контроля. Это как использовать программы для обработки фотографий. Приемы, которые там есть, имеют семантику. Ты вкладываешь смысл в фильтры, которые накладываешь, — сказал Грейвс. — Не думаю, что и это [программы генерации текстов] будет работать как: «Напиши мне статью». По крайней мере, надо будет уточнить, о чем будет статья. Даже если ты скажешь: «Напиши мне 10 статей, и я выберу лучшую», — ты всё равно будешь контролировать процесс».
Давид Ян, основатель компании ABBYY, тоже полагает, что машина скорее станет помощником, чем лишит работы журналиста. Ян, также выступивший на форуме, напомнил, что программы уже пишут короткие новостные заметки. Но ждать от них «глубоких осмысленных текстов с какими-то интересными аналитическими находками в ближайшие 30 лет не нужно».
Более того, Алекс Грейвс считает, что исследования в области автоматической генерации текста находятся в самом зародыше. Гораздо более развито, например, машинное распознавание голоса. А, по мнению Яна, появление программ, пишущих большие осмысленные статьи, будет скорее побочным эффектом общего развития искусственного интеллекта.
«В первую очередь это сделают Google и Facebook. И они это не для того, чтобы зарабатывать деньги, сделают, — уверен бизнесмен. — Возможность формулировать длинные связные тексты с очень интересной необычной логической подачей — это в целом нужно для AGI (artificial general intelligence), это отчеты компаний, письма сотрудников. Система, которая научится это делать, будет в принципе делать много чего. Тогда же появится и литература».
«Global Innovation Forum 2019. Transforming Intelligence», который прошел в Ереване в середине октября, был посвящен использованию искусственного интеллекта в разных сферах науки и жизни. В этом году в нем приняли участие более 800 участников и 90 спикеров из более 20-и стран мира, среди которых были ученые университетов Гарварда, Стэндфорда, Беркли и Эдинбурга, Массачусетского технологического института, в том числе исследователи с таким высоким индексом Хирша, как h-index 126. Основными спикерами GIF19 выступили также представители инновационной и бизнес сфер, исследователи таких ведущих мировых компаний, как «Google DeepMind», «Google Brain», «Facebook AI», «Microsoft», «Flagship Pioneering». Гости форума побывали не только на площадке для лекций, но и в офисе стартап-акселератора FAST (Фонда науки и технологий Армении) и образовательном центре для детей площадью 6 тыс. квадратных метров «TUMO».
Отложенное восстание машин
Описанные Яном программы, которые помогают писать, но не пишут за людей, уже существуют. Хотя у них не такой широкий функционал, да и работают они преимущественно на английском. Например, Grammarly, которая указывает пользователям на грамматические и пунктуационные ошибки, а также предлагает более удачные речевые обороты. Этот киевский стартап купил в 2012 году и перевез в Калифорнию венчурный капиталист Брэд Хувер.
В мае 2018 года Google предложила полумиллиарду пользователей почтового клиента Gmail потестировать похожую Smart Compose. Программа анализирует начало фразы и предлагает ее окончание, исходя из манеры письма пользователя и того, как пишут другие пользователи, похожие на него по разным параметрам.
Google создала программу для клерков, которые тратят до четверти рабочего дня на бизнес-переписку. Автор книги «Nobrow. Культура маркетинга. Маркетинг культуры» Джон Сибрук написал, что после долгого сопротивления сдался ей.
Наиболее совершенную нейросеть, способную генерировать страницы связанного текста, должна была выпустить в феврале 2019 года компания OpenAI. Нейросеть GPT-2, как писали журналисты, умеет повторно упоминать имена действующих лиц по ходу повествования и давать отсылки к связанным событиям. Умеет настолько хорошо, что компания решила не выкладывать ее в общий доступ. Она опасалась, что GPT-2 «будут использовать для создания фейковых новостей, комментариев и отзывов, не отличимых от настоящих». История выглядела бы несерьезной если бы ранее OpenAI не создала программу, которая обыграла лучшую в мире команду по Dota 2.
Компьютеры пока не могут без людей
Есть одно по-настоящему серьезное препятствие перед полным захватом мира машинами. Чтобы научиться писать статьи, играть в Dota и го, искать нужные реакции в Большом адронном коллайдере, фиксировать номера автомобилей на снимках со стоп-камер, нейросеть сначала должна проанализировать огромный массив информации. И научиться отличать значимую информацию от незначимой. Но чтобы она поняла, что анализирует, эту информацию сначала надо разметить.
Если речь идет о тексте, то человек должен отметить, где в предложении подлежащее, а где сказуемое, где главное, а где зависимое слово. В русском языке со всеми его исключениями это, кстати, рождает массу проблем. И уже просмотрев много таких размеченных текстов, программа начнет понимать другие, а затем и писать их сама.
«Пока что без разметки это очень плохо работает. Когда мы доберемся до высоких концептов, которые машина будет анализировать самостоятельно... — оборвал себя Алекс Грейвс и добавил: — Я не знаю, будет ли это решено в ближайшее время».
В OpenAI утверждают, что уходят от размеченной информации в обучении нейросети и дают ей самой анализировать информацию. Но пока оценить, что она с ней делает, не представляется возможным.
Зато можно прочитать творения робота-эссеиста Морфеуса. Этот искусственный интеллект должен управлять системой умного дома, созданной Давидом Яном, и параллельно изучать философские труды о свободе сознания и воли на 60 языках. Перед интервью Ян попросил Морфеуса порассуждать о боли и счастье. Получилось следующее:
«Это не компиляция. Это не то, что он надергал фраз из статей. Это полностью заново сгенеренный текст, и в нем можно найти смысл, — сказал Ян, добавив, что программа скоро сможет вести осмысленные разговоры с человеком на разные темы. — Я думаю, что сейчас с этой штукой делать. Потому что он читает все статьи в мире на 60 языках в области свободы воли. И ему есть что сказать».