В наше время термин “персональные данные” скорее вызывает снисходительную улыбку, чем что-то другое. Массовые утечки, взломы, появление новых уязвимостей в популярных приложениях и прочие вещи свидетельствуют совершенно не в пользу тезиса о цифровой безопасности. Сегодня наши данные — это новый товар. Более того, по оценкам большинства экспертов в массовом смысле — это безумно дорогой товар. Но только ли для продажи или “тотальной слежки” используются наши данные? Может есть и менее очевидные причины? И вообще, кто наши данные собирает, кому это нужно? Именно об этом и поговорим в этой заметке.
▪︎ ▪︎ ▪︎
Для начала давайте ответим на вопрос: “Кто собирает наши данные?” Это будет полезно для раскрытия основной темы — зачем это делается.
Можно сказать, что условно существует 3 уровня работы с данными. Каждый из них имеет свою специфику, мотивацию и прочее.
1️⃣ Первый уровень — государство. Считается, что это самый главный и влиятельный интересант в контексте сбора и обработки наших данных (спойлер: на самом деле нет). “Большой брат” и вот это вот все. К государству относятся различные силовые ведомства, армия, спецслужбы, государственные организации типо налоговой, ЦБ, судебная система и прочее. Все это части одной большой структуры, которая в целом собирает и накапливает данные о гражданах для разных целей. Есть миф, который гласит, что государство знает о нас все и чуть ли не у каждого в доме стоит прослушка и камера. Разочарую вас: при всех возможностях и бюджетах, государство знает о нас куда меньше, чем следующая категория.
2️⃣ Второй уровень — частные корпорации. Вот кто реально “правит балом”. Для примера: Facebook на сегодняшний день является лидером по количеству хранящихся на серверах о обрабатываемых пользовательских данных ВО ВСЕМ МИРЕ. Аудитория Facebook — 2,8 млрд. пользователей. Другой пример: WhatsApp. Его аудитория на сегодняшний день чуть больше 2 млрд. уникальных пользователей. Забавно то, что обе эти компании имеют отношение к одним и тем же людям, как и Instagram (1,3 млрд. пользователей). Какие еще компании можно отнести ко второму уровню? Apple, Microsoft, Huawei, PornHub и многие другие. Ни одному государству с любым бюджетом не снился тот объем и качество данных, которыми обладают все вышеперечисленные товарищи. Поэтому, на самом деле, “миром правят” частные корпорации.
3️⃣ Третий уровень — “частные заказчики”. В контексте нашего разговора это даже смешно рассматривать, но поговорим и об этом. Самые простые примеры: условный детектив собирает информацию о конкретном физлице или компания проверяет на благонадежность своего контрагента, или владелец бизнеса проверяет активы своего партнера и прочее. То-есть третий уровень, это когда сбор информации осуществляется совершенно с мизерными бюджетом (по сравнению с государством и огромными корпорациями) и в частных интересах для конкретных целей. Это некий повседневный (оперативный) уровень сбора информации.
В этой заметке, естественно, мы будем больше говорить про государство и крупные компании. И теперь перейдем к вопросу, каким образом наши данные используют и зачем их вообще собирают.
▪︎ ▪︎ ▪︎
“Слежка” и цифровой контроль
🕵🏻♂️ Интересант: государство и частные компании.
🎯 Цель: быстрое получение оперативной информации, контроль граждан и анализ настроений.
Наверное, это первое, что приходит в голову любому человеку в контексте нашей темы. Действительно, в последние годы концепция “Большого Брата” приобретает новые краски, потому что, частично она уже воплощена в жизнь.
Самый яркий пример так называемого “цифрового концлагеря” — это Китай: система социального рейтинга, полный контроль за большинством областей жизни граждан через одно приложение (We Chat), крутая система распознавания лиц и другие прелести киберпанка.
Нужно понимать, что весь мир идет именно в этом направлении. Китаю просто удалось это сделать быстрее остальных, хотя есть та же Америка, которая недалека от Китая в этом смысле. Ну и про Россию тоже не стоит забывать. Мы перенимаем лучший опыт азиатских и западных коллег. Пандемия это очень хорошо показала.
Плохо ли все это? И да, и нет. Так просто есть. Это неизбежная история, поэтому нужно просто адаптироваться под новые реалии.
Реклама
🕵🏻♂️ Интересант: частные компании.
🎯 Цель: создание идеального рекламного предложения для конкретного пользователя.
Про эту историю тоже слышало большинство. Пока что, это ключевая причина, по которой частным компаниям нужны наши данные. Для многих из них — это основной заработок (особенно для соц.сетей).
Разберем алгоритм на примере Facebook. Мы регистрируемся и заполняем анкету о себе (интересы, фото, место учебы и работы и прочее). Далее мы начинаем заполнять профиль новыми фото, репостами друзей, подписываемся на определённый контент и прочее. Алгоритмы faсebook потихоньку заполняют наш цифровой профиль новыми данными (мы этого, естественно, ни как не замечаем), формируя идеальный рекламный портрет. После этого либо сам faсebook начинает предлагать нам товары/услуги, которые максимально подходят под наши увлечения, гелокацию и финансовое положение, либо это делают сторонние компании, которым faсebook продал наш цифровой портрет. Либо это делают аффилированные компании, типо Instagram в случае с Facebook.
Это самое примитивное объяснение того, кого работает современная реклама в интернете. Есть масса вариаций описанного алгоритма, но суть вы уловили.
Управление передвижениями
🕵🏻♂️ Интересант: государство.
🎯 Цель: анализ передвижений толп людей для улучшения логистики; предсказания проблемных мест по плотности трафика в крупных городах; управление передвижениями людей.
До этого пункта было все довольно понятно. Теперь начинаются менее очевидные причины использования наших данных.
В России эту тему публично впервые подняли в момент пандемии несколько месяцев назад. Речь шла о том, чтобы поставить всем на телефоны специальное приложение, которое смогло бы отслеживать нашу геолокацию и предупреждать нас о том, есть ли рядом человек, который еще не переболел COVID-19 (для этого в приложении нужно было вносить информацию о своем статусе). Но, тема не зашла.
В реальности же, подобные технологии давным давно используются в той же Америке. Ключевые механизмы анализа толпы — это какие-то предустановленные приложения на смартфоне, которые могут передавать геолокацию заинтересованным лицам, либо камеры видеонаблюдения, которые анализируют количество людей на квадратный метр + иногда могут приблизительно распознавать настрой толпы (спокойная, взбудораженная, агрессивная и прочее). Помимо логистических целей, тут еще есть история про митинги и вот это вот все. Если у вас стоит прокаченная система камер, вы можете заранее узнать в каких местах осуществляется сбор людей, сколько групп, куда двигаются и прочее. Возможностей открывается очень много.
Управление общественным мнением
🕵🏻♂️ Интересант: государство и частные компании.
🎯 Цель: качественный анализ настроений в обществе, с целью принятия грамотных политических и управленческих решений.
Эта история тоже далеко не футуристичная и существует очень давно без всякой цифровой среды. Называется это пропаганда (не всегда со знаком минус). Чем же современная пропаганда отличается от ее “предшественницы”? Только более продвинутыми технологиями сбора и обработки информации. Приведу пример не о пропаганде, а об анализе настроений людей. Есть чудесная книга: “Все лгут. Поисковики, Big Data и Интернет знают о вас все”. В ней есть глава, которая описывает предвыборную компанию Трампа. Так как он республиканец, то и взгляды на различные “национальные вопросы” у него соответствующие, как и у его электората, соответственно. Вспомните стену на границе с Мексикой. Так вот, его команда решила проанализировать каких взглядов придерживается большинство в каждом из штатов. Пошли они не стандартным путем: одно из их решений — анализ географии использования слова “нигер” по конкретным штатам. Каково же было их удивление, когда они выяснили, что большинство населения США постоянно используют это слово (хотя в СМИ говорят обратное). Поисковые запросы точно не лгут. В общем все это очень тонкие материи, но в итоге, благодаря этому приему Трамп забрал свое большинство в ключевых для него штатах. Рекомендую прочитать этот отрывок, да и книгу в целом. Она очень крутая.
Если подытожить, то государство и частные компании собирают наши данные еще и для того, чтобы понимать, а что конкретно сейчас происходит в обществе. Исходя из этого — принимать выгодные им управленческие решения и корректировать взаимодействие с народом.
Системы прогнозирования поведения
🕵🏻♂️ Интересант: государство и частные компании.
🎯 Цель: прогнозирование и предотвращение общественно-опасных деяний (масшутинг, скулшутинг, “группы смерти”, экстремизм и прочее), машинный анализ поведения.
Тут мы все сразу вспоминаем шикарный фильм Спилберга “Особое мнение”, в котором рассказывается про подразделение “профилактики преступлений” (это когда человек еще не совершил преступление, а его уже поймали, так как он только собирался) ну или крутое аниме «Психопаспорт». Звучит вообще нереально, но попыток уже довольно много. Зачатки — это создание банка данных преступников или педофилов в США, чтобы оперативно сужать круг поиска подозреваемых в случае необходимости.
Другое веяние — это в целом создать системы, которые могут анализировать противоправное поведение. В последнее время интернет пестрит подобными новостями о выделении грантов на создание системы прогнозирующей суициды у подростков, или прогнозирование скулшутеров по анализу соц.сетей, или создать нейросеть, которая будет проводить профориентацию и многое другое. Пока что стоит констатировать тот факт, что подобные решения не будут работать, так как тут недостаточно просто выгрузить огромный массив персональных данных. Тут надо подключать качественных специалистов по анализу поведения, которые еще и смогут найти общий язык с программистами. Короче это очень сложные и в ближайшие годы не реализуемые задачи.
А что мы имеем сегодня в области машинного анализа поведения?
Это более-менее рабочие алгоритмы распознавания базовых эмоций у людей (и то, пока еще сырые).
Не плохие системы анализа уровня стресса по голосу (но, в любом случае, нужен оператор).
Наверняка есть что-то еще, но оно точно не работает, иначе об этом знали бы все.
▪︎ ▪︎ ▪︎
Надеюсь, что после прочтения этой статьи, вы осознали, что помимо тотальной слежки и рекламы существуют и менее очевидные причины для сбора и аналитики наших данных.