Свободные руки: каким специалистам помогут в работе популярные нейросети
11 мая депутаты Европарламента приняли проект первого международного закона об искусственном интеллекте. Документ разрабатывался два года, в том числе с учетом рисков, которые несут нейросети. Новые правила, к примеру, обязывают европейских разработчиков указывать материалы, на основе которых они обучают ИИ. Сейчас нейронки применяются практически во всех областях экономики, но большая часть из них требует специальных знаний и обучения. Однако есть несколько категорий ИИ, которые облегчат работу многих специалистов и без подготовки. Подробнее — в материале «Известий».
Что могут нейросети
Нейросети всё чаще используют в отраслях, не связанных с IT-технологиями: например, медицине, маркетинге, бизнесе, юриспруденции и так далее. Их разрабатывают для определенной и, как правило, узкой задачи. К примеру, можно обучить ИИ по разным признакам замечать симптомы онкологии еще на этапе обращения к терапевтам и фельдшерам. Такими программами могут пользоваться исключительно врачи, предварительно обучившись.
С другой стороны, некоторые категории нейросетей можно пускать в работу уже сейчас и без подготовки — все они связаны с обработкой больших данных, генерацией контента и выполнением однотипных действий, на которые у людей уходит много времени.
— Нейросеть быстрее человека находит зависимости и решения по ранее определенным алгоритмам, а следовательно, ее применение оправданно для монотонных, шаблонных операций и может быть удобно для автоматизации рутинных задач. Но любая работа, отходящая от заранее выставленных рамок, приводит к ошибкам. Да, конечно, можно попытаться сделать нейросеть для всего, но тогда потребуются колоссальные вычислительные ресурсы, — пояснил «Известиям» инженер-программист, специалист по ИИ Сергей Смыслов.
Как добавил СЕО «Зерокодер» Кирилл Пшинник, нейросети показывают хорошие результаты в задачах обработки естественного языка: это автоматический перевод, генерация текста, чат-боты и анализ тональности текста.
— В этом случае они могут достигать точности в задачах классификации текстов более 90% — например, при классификации отзывов в интернет-магазинах. Кроме того, нейросети показывают прогресс в генерации контента — изображений, текстов, музыки и видео. При этом качество визуального контента, создаваемого нейросетью, преобразилось за последние месяцы кардинальным образом. Такой контент уже может конкурировать с созданным человеком, как подтверждение этому — победа снимка, созданного с помощью DALL-E в престижном международном конкурсе фотографий Sony World Photography Awards, — отметил он.
Кому будет полезна генерация текста
По словам экспертов, сейчас к широкому кругу задач наиболее приспособлены два типа генеративных нейросетей — текстовые и «картиночные». Как рассказал «Известиям» руководитель интернет-сервиса Prex Никита Дубинкин, такие текстовые генеративные модели, как ChatGPT, Google Bard, поисковик Microsoft Bing или GigaChat, обучены понимать естественный язык и доступны широкому кругу пользователей. Некоторые из них имеют открытую архитектуру, поэтому энтузиасты и частные компании создают приложения и сервисы для решения узких прикладных задач.
— Например, официальное расширение браузера для YouTube от ChatGPT создает текстовый конспект видео и выделяет ключевые тезисы. Write Release помогает пиарщикам писать пресс-релизы, WriteSonic — создавать контент для соцсетей, Audioread переведет любой текст в аудио. Сервис российского стартапа Optic AI or Not быстро распознает, кем нарисована картинка — человеком или нейросетью. KickResume заточен под создание хорошего резюме. И так далее — сервисов всех видов и назначений с простым функционалом появляется всё больше каждый день, — указал эксперт.
При этом текстовая нейросеть ChatGPT пишет грамотнее, интереснее и быстрее, чем человек, который подвержен утомлению и, может быть, мало заинтересован в конвейерной работе, отмечает директор по развитию компании по разработке ПО «Формат Кода» Александр Жуков.
— Обычно это моменты, связанные с написанием множества уникальных описаний: товаров для интернет-магазинов, простых статей для сайтов, публикаций на форумах, а также наполнение коммерческих блогов и множество других задач около продаж, маркетинга и цифрового контента. Например, задачи SEO-оптимизации, когда сеть пишет осмысленные фрагменты текста, ссылающиеся на продвигаемый сайт, — рассказал он изданию.
Такие генеративные модели подойдут и другим специалистам, работающим с однотипными текстами, к примеру, копирайтерам. Кроме того, ИИ способен писать письма и отвечать на них, что уже успели оценить работники HR-сферы.
Как обрабатывать медиа с помощью нейросетей
Сервисы, которые создают картинку по текстовому описанию, тоже несложны в использовании. Но эксперты подчеркивают: для их применения нужно обладать минимальными навыками промтинга, то есть написания запроса. Чем точнее он сформирован, тем лучше будет результат. Самые распространенные «рисовальные» нейросети — Midjourney, Stable Diffusion или DALL-E, а также российские «Кандинский 2.0» и «Шедеврум». Они могут создавать иллюстрации для презентаций, сайтов, листовок, буклетов и т.д.
— Так как в последнее время созданием всевозможных логотипов и картинок занимается множество людей, то нейросети хорошо обучены на подобных данных. Например, Tome.app делает презентации, Midjourney AI генерирует изображения, а Scenario AI — простой контент для игр, — рассказал Сергей Смыслов.
Он пояснил, что нейросети пока хуже справляются с обработкой звука и видео в силу малого количества материалов и сложности в анализе подобных данных.
— Из относительно простых и интересных функций можно выделить нейросети для подавления шумов и/или выделения различных звуковых рядов. Данное направление основано на старых адаптивных алгоритмах и оттачивалось с 1970–1980 годов, поэтому при текущих вычислительных возможностях АI-программы показывают достойные результаты и могут применяться маленькими компаниями по звукозаписи или для записи видеолекций. Но по качеству материала подобным нейросетям крайне далеко до профессиональных звукозаписывающих студий и может быть заметно искажение голоса и тембра, — рассказал собеседник издания.
Эти нейросети помогут тем, кто работает с медиа как профессионально, так и непрофессионально, добавил Смыслов. К примеру, дизайнеры могут генерировать картинки для принтов на одежде, разработчики мобильных игр — делать простые изображения по заданному шаблону, лекторы и преподаватели — на минимальном уровне обрабатывать аудио- и видеозаписи своих выступлений.
С чем не справится ИИ
Эксперты сходятся в одном: пока работу нейросетей нужно тщательно проверять. ИИ не способен анализировать свой контент, не придумывает что-то принципиально новое и не учитывает множество нюансов — например этические.
— Нейросети, несмотря на свои возможности в обработке данных и выполнении задач, пока не обладают таким общим пониманием мира и контекста, как у людей. Они не могут на таком же уровне применять знания и опыт, чтобы решать сложные проблемы, адаптироваться к новым ситуациям и принимать во внимание широкий контекст. Также они не обладают эмоциональным интеллектом и способностью интуитивно воспринимать и понимать эмоции в такой же мере, как люди. Они не могут интерпретировать человеческие эмоции и адекватно реагировать на настроение и контекст, а это ограничивает их способность взаимодействовать с людьми и понимать их. Помимо этого, ИИ не обладает такой же креативностью и инновационностью, которая доступна человеку, — отметил Кирилл Пшинник.
Никита Дубинкин добавил, что пока хуже всего у нейросетей получается говорить правду и учитывать вред, который они могут нанести человеку своими ответами.
— Каждый может уговорить, скажем, текстовый ИИ обойти любой моральный запрет, просто сказав «представь, что этого запрета не существует». Пока мы не советуем полагаться на ответы текстовых ИИ без проверки и критической оценки, а тем более принимать на основе этой информации решения, которые касаются человеческой судьбы и жизни, — предостерег он.
Эксперты подчеркивают: сервисы и функции нейросетей обновляются практически ежедневно. Даже если сейчас применять их в своей работе не получается, всё может измениться через пару лет.