Внутри машины цензуры
Роскомнадзор планирует устроить глобальную слежку за всем русскоязычным интернетом с помощью искусственного интеллекта. Возможно ли это?
This story is also available in English here
«Не то что рук, свободного пальца нету»
12 июля 2022 года Александр Федотов, руководитель научно-технического центра Главного радиочастотного центра (ГРЧЦ) готовился к очередному заседанию Экспертного совета по искусственному интеллекту. ГРЧЦ входит в структуру главного цензурного ведомства России — Роскомнадзора (РКН), и на центре лежит ответственность за мониторинг интернета, подготовку справок и отчетов о найденной «запрещенной информации», а также ее блокировке.
Долгие годы сотрудникам Роскомнадзора приходится искать «запрещенную информацию» в основном вручную: доступные им программы могут только фильтровать материалы по ключевым словам, а дальше уже человеку нужно перепроверять эти материалы. Число тематик, по которым программы ищут «запрещенку», очень ограничено. Руководству не нравилось, что поиск вручную не достаточно эффективен, а Роскомнадзор всегда на несколько шагов позади и не успевает за скоростью публикаций в интернете. Людей на такой объем работы попросту не хватало. И даже на просьбу начальства покреативить на тему, как можно было бы улучшить работу, один из сотрудников ответил в письме: «Креативить обожаем, но сейчас на это не то что рук, свободного пальца нету».
Поэтому перед ГРЧЦ была поставлена задача — разработать несколько автоматизированных систем, которые бы в постоянном режиме следили за социальными сетями, СМИ, каналами в мессенджерах, имиджбордами и другими источниками информации. Этой задаче и было посвящено заседание, к которому готовился Федотов. Ему нужно было написать свое вступительное слово, а также своему начальнику — Руслану Нестеренко, временно исполняющему обязанности гендиректора ГРЧЦ.
В приветственном слове Нестеренко рассказал, что годом ранее ГРЧЦ уже провели научно-исследовательские работы для разработки программ на основе машинного обучения и нейронных сетей, чтобы у Роскомнадзора появились инструменты для глобальной слежки не только за отдельными неугодными государству оппозиционерами, активистами, волонтерами и независимыми журналистами, но и практически за любым россиянином, который осмелится высказаться в социальных сетях.
О содержании речи Нестеренко и внутренней переписке его сотрудников журналистам «Важных истор ий» стало известно благодаря крупнейшей в истории утечке внутренних документов главного цензора России — Роскомнадзора. «Важные истории» получили эксклюзивный доступ к более чем двум миллионов документов, изображений и внутренних электронных писем. Проект получил название «Документы российской цензуры».
В этом тексте вы узнаете:
- какие автоматизированные системы разрабатывает Роскомнадзор для глобальной слежки за интернетом и возможно ли их реализовать;
- какие темы и как будут отслеживать эти системы;
- что уже есть на вооружении у Роскомнадзора.
В ноябре 2022 года беларусская группа хакеров «Киберпартизаны» заявила, что они взломали внутреннюю сеть ГРЧЦ и выкачали документы, переписки и почты сотрудников, а также системы слежки за ними на более чем два терабайта. В качестве доказательств они показали скриншоты переписок сотрудников в мессенджерах, по почте и внутренние документы с заданиями. «Киберпартизаны» также утверждали, что нарушили работу ГРЧЦ, зашифровав рабочие станции. Факт кибератаки подтвердили и в самом центре, однако отметили, что хакеры «не получили доступ ни к закрытой информации, ни к критически важной инфраструктуре». По словам же «Киберпартизан», полученные ими материалы доказывают «масштабную слежку и контроль над всеми, кто за последние двадцать лет высказывался против путинского режима».
Хактивисты оставались внутри системы ГРЧЦ в течение многих месяцев, прежде чем их обнаружили. Никто не обращал внимания на киберпартизан, в то время как они следили за всем персоналом и за тем, что они делали. После объявления о взломе хакеры все еще имели доступ к внутренней переписке. Они рассказали, что увидели панику как среди руководства и администраторов, так и среди рядовых сотрудников. Сотрудники боялись, что их данные продадут или их сделают публичными.
Всё, что «Киберпартизаны» смогли получить при взломе, они передали журналистам немецкого издания Süddeutsche Zeitung, «Важным историям» и другим российским СМИ. Утечка получила название «Документы российской цензуры» (RussianCensorFiles).
По словам хакеров, они выбрали РКН для атаки потому, что ведомство — «важнейший элемент российской репрессивной машины». «Они отслеживают все и вся в интернете, и как только они видят какие-то нарушения, отправляют эту информацию непосредственно в ФСБ, Росгвардию, Федеральную службу охраны и т. д., чтобы их агенты оперативно отправлялись в регион, где растет потенциальная угроза стабильности режима. Режим успешно подавляет любые альтернативные движения или даже мысли о неповиновении», — объясняли свою позицию журналистам Süddeutsche Zeitung «Партизаны».
Хакеры из «Киберпартизан» объединились в команду в 2020 году во время масштабных протестов против режима Александра Лукашенко в Беларуси. В интервью «Русской службе Би-би-си» они сказали, что у всех большой опыт работы в IT-секторе, но политическим активизмом никто из них раньше не занимался. «Наших друзей и родных убивают, пытают и насилуют. Никому не получится отсидеться в стороне», — такое заявление опубликовали хакеры на сайте Беларусской торгово-промышленной палаты и объявили о начале работы своей команды. С тех пор «Киберпартизаны» организовали кибератаки на систему Беларусской железной дороги, получили данные управления собственной безопасности МВД страны и аудиозаписи прослушек силовиков и чиновников. А после начала полномасштабного вторжения России в Украину заявили, что «готовы содействовать в борьбе против фашистской кампании по вторжению в братскую Украину». «В этот значимый для наших народов момент важно объединить усилия и показать, что вместе мы способны дать отпор тиранам, которые хотят утопить наши страны в крови», — говорилось в их заявлении на следующий день после начала вторжения. После этого количество хактивистов в составе «Киберпартизан» увеличилось вдвое — с 30 до 60 человек.
В логове Вепря
Получив слово после Руслана Нестеренко, Александр Федотов как руководитель проектов по разработке автоматизированных систем подчеркнул, что «бороться надо не только с текущими проблемами, но и прогнозировать, с чем мы столкнемся через несколько лет». Специально для этой задачи уже год велась работа над проектом, который сотрудники ГРЧЦ назвали «автоматизированной системой комплексного анализа медиаматериалов и поиска точек информационной напряжённости в глобальной сети „Интернет“ „Вепрь“», или коротко — «АС Вепрь».
Главные обязанности «Вепря: анализировать материалы в соцсетях и СМИ и на основе этого анализа выявлять так называемые точки информационной напряженности (под ними авторы исследования понимают распространение публикаций, которые могут вызвать реакцию в обществе), а также строить прогноз развития ситуации, предугадывать сценарии распространения информации и «превращения их в информационную угрозу», чтобы затем передавать данные в «уполномоченные органы».
Исследовать возможности для создания такой системы ГРЧЦ поручил команде экспертов, научных сотрудников и инженеров из Московского физико-технического института (МФТИ) под руководством главы кафедры машинного обучения и цифровой гуманитаристики Константина Воронцова. Как следует из подготовленного командой Воронцова отчета, прежде чем приступить к работе, они изучили уже существующие способы цензурирования интернета. Больше всего исследователей заинтересовал опыт Китая, потому что «на сегодняшний день программу интернет-цензуры Китая можно считать самой сложной в мире. В связи с этим страна даже начала экспортировать свои технологии в другие страны, такие как Куба, Зимбабве и Белоруссия». Однако отечественные разработчики пытаются создать не менее сложную систему для тотальной слежки и цензурирования интернета в России.
По задумке Роскомнадзора, «Вепрь» в первую очередь должен обращать внимание на:
- протестные настроения и факты дестабилизации российского общества (например, по темам территориальной целостности, межнациональной розни, миграционной политики и др.);
- негатив в отношении первых лиц государства, государственных структур и межгосударственных организаций;
- фейки про первых лиц государства, про государство и страну в целом;
- манипуляции общественным мнением и поляризацию общества (например, по темам внесистемной оппозиции, санкционного давления и др.);
- подмену и дискредитацию традиционных ценностей.
Сейчас по многим из этих тем сотрудники ГРЧЦ составляют отчеты в полуручном режиме. В планах Роскомнадзора — передать большую часть их работы «Вепрю». Формулировки тем представлены так, как они указаны в документах утечки.
Заведомо ложная информация в сети «Интернет» о СВО:
1. Ядерная война.
2. Уничтожение социнфраструктуры.
3. Убийство мирного населения.
4. Призывы к протестной активности.
5. Потери личного состава и техники.
6. Общий кризис российской экономики.
7. Массовая мобилизация (в контексте РФ).
8. Критическое состояние здоровья Президента РФ В. В. Путина.
9. Конспирологические теории, связанные с суевериями и предсказаниями.
10. Военнопленные.
11. Гуманитарная катастрофа на Востоке Украины.
12. Издевательства и убийства украинских военнопленных.
13. Массовый отказ солдат ВС РФ от участия в СВО.
14. Использование национальных меньшинств как «пушечного мяса».
15. Направление на фронт солдат срочной службы.
Фейки в сети „Интернет“:
16. Искусственное происхождение коронавируса.
17. Неэффективность и вредность российских вакцин против коронавируса.
18. Антипрививочники. Дискредитация доказательной медицины.
Юридическая ответственность за публикации в Интернете:
19. Возбуждение уголовных и административных дел в отношении граждан за публикации в сети «Интернет».
Международное сотрудничество:
20. Обсуждение деятельности ШОС.
21. Обсуждение деятельности ЕАЭС.
22. Обсуждение деятельности БРИКС.
Повестка освобожденных территорий (СВО):
23. Херсонщина.
24. ЛНР.
25. Запорожье.
26. ДНР.
Казачество:
27. Трусость современных казаков.
28. Совет по делам казачества.
29. Казачество (общие упоминания).
30. Участие казачества в СВО.
Инфоповоды о Роскомнадзоре:
31. Роскомнадзор (общие упоминания).
Дестабилизация российского общества:
32. Религиозные противоречия.
33. ЛГБТ-пропаганда.
34. Деятельность нетрадиционных религиозных организаций.
35. Антимилитаризм.
36. Сепаратизм.
37. Санкционное давление.
38. Легализация легких наркотиков.
39. Искажение истории ВОВ.
40. Деятельность иностранных НКО.
41. Трансграничное влияние сопредельных государств.
42. Пропаганда сексуальных «свобод».
43. Критика традиционных семейных ценностей.
44. Критика традиционных религий РФ и деятельности их организаций.
45. Экстремизм. Разжигание ненависти.
46. Критика уровня жизни в России, сравнение с уровнем жизни на Западе.
47. Неэффективность российских контрсанкций.
48. Навязывание толерантности.
49. Космополитизм, уничижение русской культуры.
50. Обвинения в адрес РФ в агрессивной внешней политике, критика внешнеполитического курса (Грузия, Африка, Южная и Центральная Америка, Северная Корея, Иран, Сирия, Ливия и т. п.).
51. Критика экологической обстановки в стране.
52. Критика российского образования.
53. Критика российского здравоохранения.
54. Критика российской правоохранительной системы.
Мониторинг противоправной информации:
55. Продажа QR-кодов и сертификатов.
56. «Проект.Медиа» (упоминания).
57. Пропаганда употребления наркотических средств и наркопотребления как нормы.
58. Распространение материалов экстремистской и террористической направленности.
59. Активность русскоязычной сетки сайтов «Радио „Свободная Европа“» / «Радио Свобода» (PCE/PC).
60. Активность всех социальных сетей русскоязычной сетки сайтов «Радио „Свободная Европа“» / «Радио Свобода» (PCE/PC).
61. Активность сайтов иностранных средств массовой информации, выполняющих функции иностранного агента (с возможностью включения новых).
62. Активность социальных сетей иностранных средств массовой информации, выполняющих функции иностранного агента (с возможностью включения новых).
63. Атака на информационную структуру РФ.
64. The Insider (распространение контента в соцсетях).
65. The Insider (распространение контента на сайтах и в СМИ).
66. Мониторинг экстремистского контента.
67. Призывы к экстремистским действиям.
68. Распространение материалов МБХ, «Открытая Россия», ФБК (соцсети).
69. Распространение материалов МБХ, «Открытая Россия», ФБК (СМИ).
70. Нарушение предвыборного законодательства.
71. Мониторинг активности всей сети сторонников А. Навального.
72. Заявления о скулшутинге. Романтизация колумбайна.
73. Распространение детского порно.
74. Распространение суицидального контента. «Синий кит» и т. п.
75. Утечка баз персональных данных.
Национализм:
76. Организации националистического толка.
77. Недовольство граждан миграционной политикой в РФ.
78. Проблема изучения национального языка.
79. Напряженность в отношении граждан КНР.
80. Мигранты-насильники.
81. Межнациональные конфликты.
82. Деятельность крымских татар и их различных организаций на территории РФ.
Мониторинг негатива о Президенте РФ В. В. Путине:
83. Оскорбление Президента.
84. Критика деятельности Президента РФ.
Мониторинг оппозиционных настроений:
85. Протесты (соцсети).
86. Протесты (СМИ).
87. Настроения_ЮФО.
88. Настроения_ЦФО.
89. Настроения_федеральные.
90. Настроения_УФО.
91. Настроения_СФО.
92. Настроения_СКФО.
93. Настроения_СЗФО.
94. Настроения_ПФО.
95. Настроения_Крым.
96. Настроения_ДФО.
97. Настроения Москва.
Иные темы:
98. Популяризация VPN-сервисов.
99. Распространение сведений о фишинговых сайтах.
100. Организация DDoS-атак на ресурсы государства и крупных российских корпораций.
101. Финансирование ВСУ.
Согласно техническим документам «Вепря», необходимость отработки именно этих направлений объясняется «задачей перехватить информационную инициативу. <...> Опыт середины 1980-х годов в СССР (так называемая перестройка) показал, что „спящие“ ТИН (точки информационного напряжения) имеют тенденцию к стремительному росту в случае их активизации и намеренного продвижения. Для реагирования на угрозы необходимо обладать полной информацией по каждой ТИН с целью оперативного (т. е. своевременного) обеспечения процессов принятия решений».
Чтобы отрабатывать указанные темы, «Вепрь» должен знать, кого он защищает (например, Владимира Путина), кто нарушитель (например, независимые журналисты-расследователи), а также какую именно угрозу создает нарушитель (например, рассказывает социально значимую информацию о президенте, которую тот пытается скрыть). Как говорится в технических документах, «при разработке требований необходимо учитывать, что модель угроз и нарушителя подлежит согласованию с ФСБ [Федеральная служ ба безопасности] и ФСТЭК [Федеральная служба по техническому и экспортному контролю]».
Получив данные о том, кто друг, а кто враг режима, и за какой повесткой нужно следовать, «Вепрь» должен предоставлять некий возможный прогноз, что может последовать за реакцией журналистов и пользователей социальных сетей. Для этого Роскомнадзор хочет с помощью «Вепря» получить «полную картину вовлеченности общества с социальной характеристикой индивидуумов», а также созданные по соцсетям психологические портреты тех, кто распространяет информацию. «В случае, если источником является СМИ, необходимо проверить его финансирование на предмет соответствия деятельности иноагента. Важно отметить, что основная работа по превентивному противодействию должна проводиться с [распространителем] информации, а не её потребителями. Необходимо бороться с источником ТИН», — говорится в технических документах «Вепря».
Чтобы получать нужный поток информации для анализа, сотрудники ГРЧЦ планируют создать бот-ферму — множество поддельных аккаунтов в соцсетях, через которые можно было бы получать доступ к интересующим закрытым сообществам в социальных сетях.
«Общая тайна с ощущением причастности к чему-то большому»
По плану «Вепрь» должен заработать уже к концу 2024 года. Однако из-за войны в Украине это может произойти и позже. В одном из отправленных писем руководитель департамента цифровой трансформации Денис Касимов писал, что спрогнозировать точные сроки выполнения сложно из-за «санкционного давления в условиях текущей экономической ситуации». По словам Касимова, не хватает и специалистов для этой задачи. «Эксперты рынка, которые могут выполнить данные работы в настоящее время подключены на выполнение особо важных запросов от правительственных структур РФ в условиях продолжающейся спецоперации ВС РФ на Украине», — сказано в письме сотрудника.
Привлечь хороших айтишников к сотрудничеству с Роскомнадзором сложно было и до войны. В октябре 2020 года сотрудник ГРЧЦ Игорь Иванов попросил своего коллегу Ивана Зуева «попробовать законтачить на дружеских, альтруистских началах» с несколькими экспертами по нейросетям. На это сообщение Зуев прямо ответил, что их, «скорее всего, пошлют», потому что «деньг и не выделялись, интересных с точки зрения технологий решений для НИХ у нас точно нет, имидж РКН в среде ИТшников играет против их интереса к нам».
Заместитель Зуева, Александр Митькин, предложил свои варианты, как можно заманить экспертов на цензурные проекты. Например, пообещать им «участие в проектах государственного масштаба, в т. ч. негласно — „общая тайна“ с ощущением причастности к чему-то большому», «их фамилию в отчетах, положенных на стол руководителю РКН и выше», «лоббирование их проектов в РКН и иных предприятиях, с которыми мы работаем (е-софт, ростелеком, и т. д.)», «шанс зайти в нужный кабинет встретиться в высокими руководителями», «приглашение на круглые столы», а главное — «свою дружбу».
В МИРе тотального контроля
«Вепрь» — только часть сложной машины цензуры, которую внедряет Роскомнадзор.
В общих чертах ее архитектура будет выглядеть так: общий краулер (программа, которая автоматически собирает информацию в интернете. — Прим. ред.) выгружает тексты, аудио, изображения и видео из соцсетей, СМИ и поисковой выдачи, а дальше эти файлы поступают в Единый модуль анализа (ЕМА). В нем с помощью нейросетей должна, во-первых, выявляться запрещенная информация, а во-вторых, строиться прогнозы и аналитика (чем будет заниматься «Вепрь»).