Выборы в США прошли три года назад. Но людей до сих пор будоражит мысль, что кто-то может проанализировать их информацию в соцсетях и повлиять на них с помощью персонализированной рекламы. Мысль не новая. Этим каждый день занимаются специалисты по рекламе. Почему с ними никто не пытается бороться и как устроен рынок личных данных пользователей, разбирались «Известия».
В конце июля в стриминговом сервисе Netflix вышел документальный фильм The Great Hack. Пожалуй, самый близкий перевод на русский — «Великий взлом». Фильм о том, как британская контора Cambridge Analytica скачала данные миллиардов пользователей Facebook. Составила по ним психологические портреты. И показывала этим пользователям персонализированную политическую рекламу. Будто бы благодаря этому британцы проголосовали за Brexit, а американцы — за Трампа.
Интерес документалистов к истории понятен — политика, соцсети, большие данные. В общем, человечество в опасности. Что режиссеры Карим Амер, Джехен Нужейм забыли упомянуть, так это то, что те же самые технологии каждый день используют самые обычные рекламные агентства. И методы таргетирования политической рекламы и зубной пасты одинаковы.
Да, за вами следят
Скачать данные о пользователях любой сети может человек, чуть-чуть обладающий знаниями программирования, объясняет «Известиям» Лилия Глазова, директор исследовательской компании в области коммуникаций PR News. Есть технология API. И она написана в абсолютно открытом доступе в документации соцсети.
Небольшие компании не выкачивают информацию о пользователях в больших объемах. «Во-первых, не все соцсети предоставляют всю информацию для скачивания через API, — говорит директор исследовательской компании. — Во-вторых, всегда существует ограничение количества запросов в секунду. Что означает, что ты можешь получить список подписчиков какой-нибудь группы, в которой 10 тыс. человек. Но получить список подписчиков группы, в которой 50 млн человек, ты не сможешь либо будешь делать это очень-очень долго. Тот же самый Facebook на третий день скачивания тебя спросит, зачем ты это делаешь».
По словам Глазовой, есть фирмы, которые делают это профессионально и быстро. Либо у них есть контракт с соцсетью на передачу информации. Либо их серверы способны чаще обращаться к сайту, но опять-таки они прошли проверку соцсети.
Глава одной из таких фирм, который согласился побеседовать с «Известиями» на условиях анонимности, подсчитал, что за сутки они выкачивают 100 млн сообщений из всех соцсетей на русском языке. В пике — до 30–40 тыс. сообщений в секунду.
Сбор происходит только по тем данным, к которым пользователь не ограничил доступ настройками приватности, пояснил «Известиям» Евгений Ищук, генеральный директор агентства Control Digital.
Евгений Ищук, генеральный директор агентства Control Digital
В финальном виде мы получаем текстовый документ со ссылками на профили пользователей, которые в дальнейшем нужно загрузить в рекламный кабинет для того, чтобы показывать им рекламу. Например, у нас цветочный магазин, и мы хотим, чтобы мужчины поздравляли своих жен и девушек нашими цветами. Мы находим молодых людей, у чьих жен/девушек будет день рождения в ближайший месяц, и показываем им рекламу с предложением подарить наш фирменный букет.
Хорошая новость в том, что никто не имеет права использовать ваши персональные данные, скрытые или открытые, без вашего согласия. Это прописано в законе «О персональных данных» (152-ФЗ). Плохая новость в том, что вы уже на всё дали согласие.
«Почти на всех сайтах и в соцсетях, прежде чем отправить номер телефона или другую информацию, вас попросят ознакомиться и принять пользовательское соглашение об обработке данных. Если пользователь дал согласие, то компания может использовать пользовательские данные для обработки, в том числе для рекламы», — рассказал «Известиям» Александр Морозов, управляющий партнер агентства Мэйк.
Вас анализируют
Персонализированная реклама цветов, зубной пасты, кандидатов в президенты — имея данные пользователей, можно делать не только это.
Глава компании, которая выкачивает и анализирует данные пользователей
Самое нехорошее, что можно, — это не вот эти электоральные приколы, а вычислять всё про людей. Вообще всё. Низводить анализ прям до адреса. Если мы хотим вычислить что-то про футбольных болельщиков, они все там [в соцсетях] есть. По каждому из них можно составить индивидуальный портрет: выявить уровень стресса, готовность к теракту, предсказать размер митинга — сколько людей, которые заявили, что на него пойдут, на самом деле пойдут.
Но чтобы не искать каждого футбольного фаната или покупателя цветов вручную, нужно распределить пользователей по группам — типологизировать их. Считается, что Cambridge Analytica делала это по модели «большая пятерка». Предлагала пройти личностный тест, а потом прогоняла результаты пользователей и другие их данные через программу, которая измеряла их 1) экстраверсию, 2) доброжелательность, 3) добросовестность, 4) эмоциональную устойчивость и 5) открытость опыту. Делила так людей по психотипам и показывала им разный контент.
То, что это происходило именно так, к тому же значительно повлияло на выборы, вызывает большие сомнения у Игоря Ашманова, генерального директора компании «Ашманов и партнеры», которая занимается интернет-маркетингом. «До сих пор не доказано, что у людей есть устойчивый психотип. А тем более то, что он вычисляется по постам и лайкам и может показать электоральные предпочтения. История о том, что есть «большая пятерка» и мы по 100 лайкам узнаем о человеке больше, чем жена знает, — это туфта», — заявил «Известиям» эксперт.
Игорь Ашманов, генеральный директор «Ашманов и партнеры»
Есть модели, которые позволяют по профилю человека, по тому, что он пишет, получить его психологический портрет на 50 страниц. Не эта ерунда про открытость опыту, а склонность к агрессии, к алкоголю, к наркотикам, к порно, экстремизму и т.д. Такие вещи могут использоваться для государственных структур, чтобы понять настроение человека в деструктивной группе. Для кадровых отделов — выяснить «пахнет» ли наркотиками от человека, который пришел наниматься.
Лилия Глазова стоит на иной позиции — теория психотипов работает, просто не нужно ее, во-первых, упрощать, во-вторых, считать универсальной: «Существует много теорий психотипов. Они рабочие. Но если их использовать, важно верифицировать их другими теориями для проверки Психотипом ведь даже является, новичок ты в покупке чего-то или давно покупаешь этот товар. По профилям в соцсетях этого понять нельзя. Мы сосредотачиваемся на действиях и на контенте, который люди пишут. По нему мы можем понять, что это, например, хипстеры — молодежная аудитория, использующая такой-то язык. Или это рокеры, аудитория, использующая такой язык. И они в большей степени привержены этому продукту».
По теории психотипов или без нее маркетологи делают выводы о пользователях соцсетей. И делают их достаточно точно, чтобы на этом зарабатывать, напоминает Александр Морозов: «Так как чаще всего оплата рекламы происходит по модели CPM (цена за тысячу показов), то для получения значительного эффекта от рекламы необходимо показать объявления максимально целевой аудитории».
Закон вас не защищает
Сбор данных из соцсетей как самими соцсетями, так и сторонними компаниями пока находится в серой зоне с юридической точки зрения. Все это делают, но говорить об этом открыто не хотят, как анонимный источник «Известий». «Механизм таргетированной рекламы используют все. На этом создана система продажи рекламы поисковика, соцсети — это их хлеб, это деньги, на которые они живут», — подтвердила «Известиям» Лилия Глазова.
В России есть упомянутый 152-й федеральный закон «О персональных данных». В нем дана очень размытая формулировка того, что такое персональные данные – «любая информация, относящаяся к определенному или определяемому на основании такой информации физическому лицу».
Указаний на то, кому принадлежат эти данные, если они выложены пользователями в открытый доступ, в законе нет. Не решили законодатели и то, могут ли третьи лица работать с этими общедоступными данными.
Узаконить этот вопрос — а это не только российская, но и общемировая ситуация — не удается из-за противостояния соцсетей (и других платформ, имеющих доступ к персональным данным, например сотовых операторов) с третьими лицами (компаниями, которые строят бизнес на анализе пользователей и показе им рекламы).
Самое громкое разбирательство ясности не внесло, и судебного прецедента создано не было. «Юридически можно доказать, что у Cambridge Analytica оказались в одних руках сбор данных [подделанный под научное исследование] и таргетированная реклама. Это этически не очень корректно. Но закона [запрещающего это] нет», — объясняет Глазова. Единственное последствие всей истории со «взломанными» выборами — то, что Facebook и Instagram закрыли для скачивания данные о друзьях пользователей.
В России в 2017–2018 годах судились Mail.ru, владеющая «ВКонтакте», и компания Double Data, которая собирала и продавала банкам открытые данные пользователей. В итоге суд запретил компании это делать, но анонимный эксперт «Известий» считает, что она просто слишком громко рекламировала свои услуги.
Противостояние идет не только в рабочих группах, где обсуждают варианты законопроектов. Соцсети постоянно усложняют выкачку данных, компании разрабатывают новые программы, чтобы продолжать это делать.
Александр Морозов, управляющий партнер агентства Мэйк
Все профили в соцсетях по факту — это открытые данные. Чтобы их получить, нужно написать простую программу скрипт, которая будет заходить на каждую страницу и считывать информацию. Если речь идет о персональных данных, которые можно получить из закрытых источников, то эти данные воруют, взломав серверы Facebook и «ВКонтакте». Как и любые системы, эти системы не идеальны, находятся дыры, и происходят сливы персональной информации. Но службы безопасности соцсетей постоянно совершенствуют защиту своих серверов и взломать их достаточно тяжело и трудоемко. Поэтому всё зависит от того, сколько за это платят и какая цель.
Игорь Ашманов считает, что законопроект о сборе личных данных в каком-то виде может быть внесен в Госдуму этой осенью. По его словам, «все законодатели склоняются к общедоступности общедоступных данных».
Так что для пользователя ситуация толком не изменится.
Как защитить себя
Обычному пользователю в этом бизнесе места нет. И вряд ли его или ее мнение будет учитываться в какой-либо стране при разработке законов об использовании персональных данных. Поэтому «Известия» попросили экспертов дать рекомендации для тех, кто хочет пользоваться соцсетями, но не хочет быть использованным для построения социологических теорий и рекламных кампаний.
Евгений Ищук предлагает несколько способов «частично провести систему». В профиле поставить минимально возможный возраст и сменить город пребывания, отключить GPS и не пользоваться Wi-Fi, а также перестать взаимодействовать с контентом — не писать комментарии, не ставить лайки и не делать репосты.
По мнению Лилии Глазовой, скоро скрыться от анализа станет невозможно, даже если ничего не лайкать, не комментировать и не репостить.
Лилия Глазова
Сейчас соцсети экспериментируют с новой моделью: показывать тебе не то, что больше лайкают, а то, что пользователи, в том числе и ты, дольше смотрят. Пока соцсети не предоставляют [компаниям для скачивания] информацию о глубине и времени просмотра [постов], но так или иначе будут. Так что скоро просто по тому, что ты смотришь, всё будет [о тебе] понятно.
Игорь Ашманов тоже испытывает большой скепсис относительно возможности спрятаться от анализа: «В принципе можно превратить себя в черное пятно для анализирующих механизмов. Но тогда они увидят черное пятно, которое перемещается по анализируемому пространству».
Он рекомендует не пытаться «стать разведчиком», а соблюдать элементарные правила цифровой гигиены: не публиковать фотографии своих детей, не обсуждать секты, не выкладывать сомнительные изображения. Сейчас Ашманов пишет книгу о цифровой гигиене для подростков.
Анонимный собеседник «Известий» посоветовал расслабиться и напомнил об исследовании 2013 года, которое показало, что Facebook — в целях изучения самоцензуры пользователей — собирает данные о каждом введенном символе на сайте и в приложении. Не о каждом опубликованном, а о каждом введенном. Это означает, что соцсеть хранит всё, что вы написали, даже если вы не стали это публиковать, а стерли в последний момент. И если хранит, почему бы не поделиться этим с теми, кто готов платить.