Под прицелом видеокамер и big data

Владимир Овчинский Юрий Жданов

4 февраля 2021 г. 10:28:05

«Новая нормальность» эпохи пандемии, связанная с беспрецедентным расширением использования технологий видеонаблюдения, геолокации и Big Data, заставляет переосмысливать всю привычную систему обеспечения прав человека.

Считается, что современная система видеонаблюдения в рамках программы "Безопасный город" в Москве появилась в 2011-2012 году. До этого она была довольно архаичной, использовалась неэффективно, многие камеры просто не работали.

В качестве ориентира и ролевой модели для Москвы был выбран Сингапур - в этом городе-государстве строилась система "умного города", которая была запущена в 2014 году. Она, например, включала в себя разветвленную сеть камер видеонаблюдения и установленные во все машины датчики, позволяющие оперативно собирать данные о пробках.

Власти Сингапура любили демонстрировать и другие чудеса новой системы. В 2013 году они показательно оштрафовали на 14 тысяч долларов человека, который выбрасывал окурки из окна квартиры: его выявили вездесущие камеры наблюдения, писал Wall Street Journal.

С начала реализации проекта, количество видеокамер увеличивалось примерно на 7-10 тысяч в год. В мае 2019-го мэр Москвы Сергей Собянин сказал, что в Москве их 167 тысяч (к началу 2021 года – уже около 200 тысяч). Мэр добавил, что видеозаписи оттуда используются при расследовании 70% всех совершенных преступлений.

Большинство камер установлены у подъездов жилых домов и административных зданий, в школах, вузах, торговых центрах. Не менее 2,5 тысяч установлены в местах массового скопления людей.

Чаще всего записи с видеокамер используются для расследования вандализма или краж (в 52% случаев) и для разбора ДТП (в 40% случаев).

Для Москвы была выбрана российская технология от компании NTechLab, которая в свое время разработала FindFace - неработающий сейчас портал для поиска людей во "ВКонтакте" по изображению. Нейросеть NTechLab позволяет обнаружить четырех из пяти разыскиваемых, лица которых хоть раз были зафиксированы хотя бы одной камерой, а время поиска человека в базе из 1 млрд снимков занимает не более 10 секунд, следует из презентации компании.

В тестовом режиме система работала в 2017 и 2018 году во время Кубка Конфедераций и чемпионата мира по футболу в Москве. По официальной версии, чтобы выявлять болельщиков из черного списка, которым запрещен проход на стадионы. Тестирование системы распознавания лиц началось в Москве в августе 2017 года - сначала на 1500 камерах. Во время чемпионата мира по футболу в 2018 году на входах на стадионы и фестиваль болельщиков работали уже более 450 специальных камер, которые автоматически сверяли лица всех заходящих с предварительно загруженной базой из 45 тысяч фотографий. За время чемпионата было задержано 19 человек, находившихся в федеральном розыске, и 49 человек, которых власти отнесли к опасным футбольным фанатам.

Гонка Москвы за покрытием видеокамерами всего пространства города не является уникальной. По данным организации Caught on Camera (она на протяжении 30 лет занимается разработкой систем видеонаблюдения по заказу государственных и коммерческих структур), в Лондоне и населенных пунктах вокруг него установлено 500 тысяч видеокамер, то есть в два с половиной раза больше, чем планируется оборудовать в Москве.

Россия по числу установленных камер для видеонаблюдения заняла третье место в мире, уступив Китаю и США, говорится в исследовании информационного аналитического агентства TelecomDaily.

Сегодня в России насчитывается около 13,5 млн камер, в то время как в Китае их 200 млн, в США - 50 млн. По числу камер на 1 тыс. человек при этом лидирует США (152,8 камеры), следом идут Китай (143,6) и Россия (93,2), отмечается в исследовании.

Больше половины камер в России (почти 8 миллионов) установлены коммерческими организациями с целью защиты собственности. Около трети (почти 4,5 миллиона) работают в школах, больницах, правительственных учреждениях и на улицах. Именно эти камеры финансируются из государственного бюджета. Остальные (почти 1,1 миллиона), по данным исследования, были установлены частными лицами.

Власти многих стран полагают, что камеры видеонаблюдения помогают снизить преступность, повышают общественную безопасность и помогают в случае дорожных происшествий. Однако, с другой стороны, есть серьезные опасения, что они также нарушают частное пространство человека. Более того, часто неизвестно, где и как хранится эта информация.

В 2020 году пандемия коронавируса открыла новую сторону использования камер. Некоторые страны стали применять высокотехнологичное слежение для того, чтобы убедиться, что люди, которых обязали соблюдать карантин, на самом деле оставались дома. Например, в Гонконге ввели в обиход «карантинный браслет», в Южной Корее и России отслеживали по геолокации в телефоне.

После нескольких лет испытаний Россия в январе 2020 года ввела в строй систему распознавания лиц. Эта технология установлена на более чем 100 000 камер в Москве.

Поэтому к началу пандемии у московских властей уже была система, которая позволяла отслеживать людей, которые должны были соблюдать карантинные меры. Людей засекали, даже если они выходили из дома всего на несколько минут выбросить мусор.

В 2020 году мэрия Москвы выделила на установку системы еще 2,7 миллиарда рублей. Большая часть этих средств – 1,4 миллиарда рублей – пошла на оснащение камерами с системой распознавания лиц вагонов метро. В каждом вагоне должно быть по 8 таких камер, но пока это относится только к четверти эксплуатационного парка вагонов. Остальные средства пошли на установку камер в трамваях, электробусах и автобусах, на расширение системы хранения данных и на мобильные комплексы для распознавания лиц на массовых мероприятиях.

Алгоритм искусственного интеллекта распознает лицо, даже если человек использует для маскировки очки, усы или бороду. Уже были факты, когда распознавались люди в мотоциклетных шлемах, медицинская маска тоже не сработает для защиты от алгоритма.

В июне 2020 года правительство России подписало контракт с «Ростехом» на установку системы распознавания лиц в школах на платформе с названием «Оруэлл». Ей планируется охватить более 43 000 школ. По заявлению Министерства образования, это делается для того, чтобы мониторить движения и действия детей, а также выявлять посторонних в стенах школ.

Дополнительные системы распознавания лиц будут установлены по всей России. Помимо Москвы еще 10 городов будут располагать такими системами в общественных местах и даже у входов в подъезды многоквартирных домов. Например, в Нижнем Новгороде планируют установить около 3000 таких камер.

МВД России разрабатывает  систему  распознавания людей по татуировкам, по радужной оболочке глаз, по голосу и по движению тела. Система распознавания по походке способна определить человека на расстоянии 50 метров, даже если он не смотрит в камеру. Она анализирует походку по длине шага, уровню наклона ступни, движению рук. Ее довольно сложно «провести».

Поскольку все технологии слежения в своей основе упираются в базу данных, МВД России создает централизованный  банк  биометрических данных с отпечатками пальцев и изображениями лиц. В банке будет собрана информация как о российских гражданах, так и об иностранцах. Его планируется создать в течение ближайших трех лет.

С самого начала установки системы распознавания лиц в Москве начали поступать сообщения об утечках данных.

Протесты, видеонаблюдение, распознание

В ходе следствия, а потом суда по "болотному делу" о беспорядках на Болотной площади Москвы 6 мая 2012 года стало понятно, что в основу обвинительных материалов легли записи с камер уличного наблюдения. Новые задержания проводились по мере поступления все новых видеозаписей, эти же кадры использовались в суде как доказательства вины демонстрантов.

Мэрия закупает планшеты и телефоны, с помощью которых сотрудники полиции и чиновники могут вести прямую трансляцию с массовых мероприятий - например, с митингов. Видеопотоки с мобильных камер подключены к ЕЦХД.

Такая же практика складывается и в январе – феврале 2021 года вокруг протестов по так называемому «делу Навального».

После первых митингов оппозиции в поддержку Алексея Навального, 23 января в мессенджере Telegram появился канал, который собирал и публиковал персональные данные полицейских и росгвардейцев, участвующих в задержаниях. Для поиска информации владельцы канала использовали программы для распознавания лиц по фотографии и уже утекшие в сеть базы данных. Публикация персональных данных может угрожать безопасности правоохранителей и их родственников.

В Telegram появился открытый канал, участники которого публикуют персональную информацию о полицейских и росгвардейцах, участвующих в задержаниях на акциях в поддержку оппозиционного политика Алексея Навального. В канале, аудитория которого составляет 8,5 тыс. человек, опубликованы имена силовиков, их фотографии, телефоны, ссылки на страницы в социальных сетях и данные о родственниках. В канал также встроен специальный поисковый механизм, в него можно анонимно загрузить данные, которые добавляются в отчет. Впрочем, Telegram использовался и для публикации персональных данных протестующих: 26 января мессенджер заблокировал канал «ОПППознание», где выкладывались их имена и фотографии, сообщало издание vc.ru.

Для поиска данных о человеке можно использовать как бесплатные, так и платные аналоги популярного несколько лет назад сервиса по распознаванию лиц на фото FindFace, который был закрыт в 2018 году. Помимо этого для вычисления личности силовиков также взламываются базы данных госструктур.

Для опознания личности могут использоваться не только специальные программы с функцией распознавания лиц. Распознать человека по фотографии в сети могут и его знакомые, которые просто впишут в Telegram-канал любые данные о нем, по которым можно в открытых источниках найти недостающую информацию.

С чем сопрягаются данные видеонаблюдения?

Естественно, что получение самих результатов видеонаблюдения, - это только начало углублённой аналитической работы, основанной на технологии Big Data.

Пол, возраст, уровень дохода, социальный статус, номер телефона пассажира в метро уже сейчас можно практически мгновенно узнать благодаря системе персональных коммуникаций.

А всего у московской мэрии есть около 170 разнообразных информационных систем. В общей картине люди - лишь часть огромного конгломерата данных, наряду с дорогами, автомобилями, зданиями, канализацией, торговыми палатками, детскими площадками и всем прочим, из чего состоит город. Мэрия наблюдает за всем сразу.

С помощью этих систем можно следить и за любым конкретным человеком.

Частично это обычная официальная информация, которой власти обладали и раньше, просто теперь она переведена в электронные базы данных. Данные о браках, разводах и детях хранятся в "едином информационно-телекоммуникационном пространстве" ЗАГС. Все обращения к врачам - в единой медицинской системе. В системе единого расчетного центра (ЕИРЦ), который отвечает за выставление коммунальных квитанций, есть данные о тех, кто зарегистрирован в квартире сейчас и о тех, кто давно выписался оттуда (так называемые "домовые книги").

Но теперь у мэрии есть и данные, которыми раньше она не обладала. Например, жители города массово живут не по месту официальной регистрации или вовсе без нее. Для получения достоверной информации о месте жительства и перемещениях жителей столицы мэрия с 2015 году закупает геоаналитические данные от сотовых операторов.

По сути, это информация о том, к каким базовым станциям подключались телефоны москвичей и с каким интервалом каждый телефон переходил от одной вышки к другой.

По скорости переподключения абонента от одной вышки к другой понятно, идет он по улице пешком или едет на автомобиле, а по тому, к какой станции телефон чаще всего подключен в ночное время - где именно человек ночует, а значит, живет.

Данные операторы передают мэрии не напрямую, а через посредника - например, через Аналитический центр при правительстве России. В общей сложности с 2015 года на закупку геоаналитической информации из бюджета Москвы было выделено более 700 млн рублей (включая затраты 2020 года), следует из информации на сайте госзакупок. За эти деньги мэрия получает так называемые "обезличенные" отчеты о количестве абонентов, проживающих и работающих в разных районах города с разбивкой по секторам размером 500 на 500 метров, а также о том, куда они ходят и ездят каждый день.

С помощью данных сотовых операторов мэрия Москвы предупреждает о закрытиях станций всех, кто проживает вокруг них, а не только официально зарегистрированных

Имея эту информацию, мэрия, к примеру, предупреждает жителей конкретного района о закрытии ближайших к ним станций метро. Такие сообщения от департамента транспорта столицы приходят не только тем, кто зарегистрирован в конкретном районе, но и тем, кто живет в нем без регистрации.

Геоаналитика используется и для расчета продовольственной обеспеченности районов: данные о реальных местах жительства людей накладываются на карту расположения торговых объектов, следует из отчетов Департамента информационных технологий (ДИТ). Кроме того, сотовые данные помогают понять, сколько людей на лето уезжают жить на свои подмосковные дачи или оценить туристический поток из других регионов России и зарубежных стран (в случае использования роуминга), следует из госконтрактов.

В мэрию отчеты поступают в обезличенном и агрегированном виде - не по каждому отдельному человеку, а сразу по большим группами людей, говорит топ-менеджер data-компании, работавшей со столичным правительством.

Данные о людях можно сегментировать по различным критериям - например, выделить абонентов определенного возраста. Благодаря этому, например, мэрия может видеть, сколько пенсионеров на самом деле соблюдает рекомендованный им режим самоизоляции.

В условиях эпидемии мэрия следит и за отдельными людьми - например, отправляя сообщения о необходимости самоизоляции пассажирам конкретного рейса. Эта форма контроля производится по другому регламенту и не в рамках контракта на покупку обезличенных агрегированных данных, говорит бывший сотрудник мэрии. Кроме того, в этом случае мэрия уже действует в связке с полицией, у которой больше полномочий такого рода.

Это чрезвычайная ситуация, в рамках нее правительство обязывает операторов делать определенные действия. Например, по запросам МЧС они могут отправить жителям конкретного района предупреждение о шторме. По такому же принципу можно действовать, если есть необходимость мониторить определенных людей.

В начале апреля 2020 года министерство цифрового развития разработало порядок наблюдения за носителями коронавируса на основании данных геолокации сотовых телефонов, отчасти легализовав тем самым практику, которая сложилась в столице в течение последних нескольких лет.

В особых случаях сотовые операторы и раньше передавали властям данные о местонахождении отдельных людей, вне режима чрезвычайной ситуации и без привлечения полиции. С 2018 года действует правило: когда житель Москвы вызывает "скорую" с мобильного телефона, в систему обработки вызовов городской станции скорой помощи поступает информация с точными координатами его местоположения - правда, пока человек все равно должен назвать свой адрес оператору скорой.

Информация с сотовых вышек - не единственное "сырье", которое московская мэрия получает от сторонних поставщиков данных.

С момента вступления первых ограничений в Москве из-за коронавируса департамент транспорта ежедневно публикует статистику и аналитику по передвижениям горожан на метро, автобусах и трамваях. В рапорты о том, что все "сидят дома", входит и информация по использованию личных автомобилей, такси и каршеринга.

Как следует из документации на создание элементов интеллектуальной транспортной системы, эти данные чиновники получают напрямую от крупнейших таксомоторных и каршеринговых компаний. Как указано в документах, данные передают "Яндекс.Такси", "Ситимобил", "Везет" и Gett.

Данные о трафике на московских улицах стекаются в Центр организации дорожного движения

В Центре организации дорожного движения (ЦОДД подведомственен Дептрансу) подчеркивают: информация о передвижении автомобилей и каршеринга - это треки движения, которые не относятся к персональным данными. ЦОДД получает агрегированные и обобщенные отчеты, сообщили в "Яндекс.Такси" и "Яндекс.Драйве". В "Ситимобиле" и "Везет" добавили, что информация передается в соответствии с двухсторонними соглашениями с мэрией.

Система дает возможность в режиме реального времени отслеживать местонахождение любого такси или взятого напрокат автомобиля, а также узнать всю историю его передвижений. Мэрия также может выгрузить последние фотографии любого транспортного средства, сделанные развешанными по городу камерами фото- и видеофиксации нарушений.

Данные о передвижениях легковых такси и каршеринга в интеллектуальной транспортной системе комбинируются с информацией с датчиков системы ГЛОНАСС, установленных на городском транспорте - автобусах, трамваях и троллейбусах "Мосгортранса", а также на уборочной технике.

Кроме того, например, ещё в 2015 году мэрия договорилась с производителями противоугонных систем о предоставлении данных о передвижении автомобилей по городу.

Система отслеживает и личный автотранспорт, благодаря все той же системе фото- и видеофиксации.

Мэрия имеет доступ к информации о владельцах автомобилей. Совместно с ГИБДД столичное правительство разработало систему "Автокод", где можно проверить историю регистрации любого транспортного средства и наличие штрафов.

На конец 2018 года на улицах в пределах Третьего транспортного кольца действовало около 2 тысяч Wi-Fi-точек, к которым за год подключились более 665 тысяч человек. Бесплатным интернетом можно воспользоваться в городских парках, библиотеках и музеях. За счет мэрии Wi-Fi получили студенты около 30 московских вузов, причем не только в учебных корпусах, но и в общежитиях.

В 2019 году столичное правительство решило объединить управление всеми точками в руках одного оператора: конкурс стоимостью 150 млн рублей выиграла компания "Максимателеком". Она же с 2013 года обеспечивает работу Wi-Fi в московском метро, но там все устроено иначе: пользователь либо платит за услугу, либо просматривает рекламу перед подключением.

По новому контракту компания не занимается обеспечением доступа в интернет: она должна запустить единое окно авторизации и внутренний портал статистики. С его помощью чиновники смогут увидеть, например, с каких телефонов москвичи пользуются Wi-Fi. Больше того - оператор вправе использовать технологию DPI для анализа трафика.

DPI - сокращение от английского deep packet inspection, "глубокий анализ пакетов". DPI представляет собой программно-аппаратный комплекс, который выделяет в общем потоке трафика конкретные сайты или приложения. Именно DPI российские власти выбрали для борьбы с нежелательными ресурсами, тестирование системы началось в конце 2019 года. Эта же технология поможет чиновникам мэрии понять, какие ресурсы чаще всего посещают москвичи.

Так, отдельно в портале статистики можно посмотреть, какие доли приходятся на шифрованные соединения, торрент-сервисы или просмотр видео. Отдельный раздел посвящен самым популярным у пользователем мессенджерам и топ-100 самых посещаемых ресурсов.

Согласно государственному контракту, в портале статистики доступны детальные портреты пользователей, составленные на основании того, что именно они делают и ищут в сети. Каким образом формируются такие портреты?

Вся информация о действиях посетителя на конкретном сайте записывается в cookies. Те, кто имеет доступ к трафику, сопоставляют их друг с другом. Действия, которые с большой вероятностью делал один и тот же человек, объединяются вместе. Так формируется обезличенный профиль пользователя, рассказывает директор крупной data-компании.

Всех подключавшихся к бесплатному городскому Wi-Fi "Максимателеком" группирует по социально-демографическим признакам - пол, возраст, состав семьи, наличие автомобиля и даже по "жизненными ситуациям", следует из документации.

Портреты могут быть максимально детальными. Вот фрагмент одного из контрактов мэрии на анализ трафика городского Wi-Fi с другой компанией. "Для характеристики "имеет автомобиль" аналитики настраивают набор качественных параметров: посещение сайтов парковок, магазинов интернет-запчастей, автосервисов и шиномонтажей; просмотр сайтов удаленных городских объектов (до которых проще добираться на автомобиле).

Еще один источник данных о поведении горожан в интернете - сайт mos.ru и связанные с ним ресурсы вроде "Активного гражданина" или "Нашего города". В 2018 году общая посещаемость порталов и мобильных приложений семейства mos.ru составила 652 млн визитов (так, через сайт мэрии прошли почти 300 млн обращений за госуслугами). В 2020 году, на фоне эпидемии коронавируса, трафик mos.ru вырос более чем на 50%.

Через собственный трекер мэрия не просто собирает базовую статистику о том, сколько пользователей заходят на городские ресурсы. В отчеты идет о информация об IP, стране и браузере пользователя. Следующая задача - составить портрет посетителей.

Система умеет работать даже с теми посетителями mos.ru, которые сознательно включили режим "инкогнито" в своем браузере, тем самым лишив владельцев сайта собирать cookies. Для этого используется технология fingerprint (от английского "отпечаток пальца"), которая является своего рода цифровым аналогом взятия отпечатков пальцев. Только вместо рук - уникальные свойства конкретного смартфона, планшета или ноутбука.

Например, fingerprint сообщает часовой пояс устройства, языковые настройки, размер экрана, класс процессора. С помощью нее можно понять, кто приходит к тебе на сайт даже в том случае, если он использует разные браузеры на своем компьютере.

Собирая детальную информацию, система СТАТС может определять, впервые ли гражданин на mos.ru или уже заходил на него. Если это не первое посещение, система объединяет все сессии вместе и выводит закономерности из действий человека - например, какие услуги ему необходимы или чем он интересуется. Базовые группы, доступные в системе: одиночные посетители, домохозяйства, схожие социальные группы (например, работники одной компании или представители одинаковой профессии).

Как следует из содержания госконтрактов, внутри этих статистических отчетов могут содержаться и социально-демографические показатели: пол, возраст, доход, семейное положение. Система также умеет находить связь между пользователями внутри группы - например, объединить вместе мужа, жену и детей, если они тоже посещают mos.ru. Мэрия с большой точностью знает, кто заходит на ее сайты.

Мэрия также собирает их биометрические данные москвичей - их изображения и образцы голоса.

Допустим, известна фамилия пассажира и его телефон. Если человек живет в Москве, он не мог не использовать государственные сервисы, и там не могла не сохраниться фотография, пусть и старая. В ход идут не только фото из паспорта, но даже те, которые были сделаны когда-то для льготных проездных школьника или студента.

В случае с заболевшими коронавирусом искать старые фото не нужно: врачей обязали делать фотографии всех находящихся на карантине.

Поиск людей по фотографии-образцу идет внутри всей системы видеонаблюдения, человека можно поставить на контроль, даже если он не живет по адресу регистрации. Машина, ежедневно обрабатывая изображения москвичей, ранжирует их по принципу "свой - чужой": тех, кто входит и выходит из одного и того же подъезда постоянно, относит к "своим", новичков - к "чужим".

Пользователь системы может уточнять и детализировать поиск в системе - заставить ее искать человека только среди "своих", только среди "чужих", или искать похожие изображения. Можно указать, за какой период нужны снимки и даже выставить точность совпадения с образцом - от 50% до 100%.

Системы московской мэрии умеют анализировать и голоса москвичей: с 2015 года все беседы горожан с сотрудниками единой городской диспетчерской службы не только записываются и затем автоматически расшифровываются в текст, но и оцениваются алгоритмами с точки зрения "эмоционального фона беседы", следует из годового отчета ДИТа.

В 2018 году подведомственное мэрии АО "Электронная Москва" провело апробацию технологии по автоматическому распознаванию бесед сотрудников сервиса "Мои документы" с посетителями центров госуслуг.

Задача, поставленная мэрией перед подрядчиком, - уметь выделять в беседах "стоп-слова", "стоп-фразы" и "слова-конфликтогены", чтобы в дальнейшем автоматизировать оценку качества обслуживания. Согласно контракту, система должна записывать все разговоры сотрудников с клиентами, чтобы отслеживать негативные ситуации по ключевым словам.

В этом проекте тестировалась технология компании "Агат-РТ".

В стратегии "Умный город - 2030", принятой в 2018 году, указано: для борьбы с преступностью, помимо системы видеонаблюдения, будут внедрены средства "акустического контроля". Речь идет о чувствительных уличных микрофонах: такие устройства уже установлены в ряде городов США и других стран. Их основная задача - распознавать звуки выстрелов, с помощью триангуляции определять их местонахождение и отправлять координаты оператору или ближайшему патрульному экипажу. Они также способны "узнавать" человека по образцу голоса и записывать разговоры: таким образом, с мест совершения преступлений полиция может получать записи не только видео, но и аудио.

Приблизительно в 2015 году мэрия пришла к идее, что пора создавать обобщающие системы, которые смогут использовать данные из разных источников. Задача таких систем - не хранить однотипную информацию вроде разрешений на строительство и номеров свидетельств о браке. Они, словно искусственный интеллект из фантастических фильмов, должны отвечать на сложные вопросы и уметь предсказывать будущее.

В Москве разработаны несколько "обобщающих систем", призванных отвечать на любимый вопрос мэра и запросы других чиновников.

Примерно тем же самым занимается известная американская компания Palantir, которая по заказу американских спецслужб переваривает огромный массив данных из разных источников и ищет в них признаки готовящихся преступлений или терактов.

ИАС ДТОИВ умеет аккумулировать и прогонять через себя данные из нескольких источников.

Во-первых, из системы мониторинга криминогенной ситуации, совместной базы данных мэрии и полиции, куда стекается информация обо всех преступлениях и хранится архивная информация о примерно 5 млн правонарушениях. Данные о штрафах, грабежах и убийствах собираются в ней не только для статистики: система умеет выявлять нетипичную динамику по преступлениям, а также мониторить общественное мнение об уровне безопасности в Москве. В том числе - на основании поисковых запросов граждан в интернете.

Во-вторых, из "Единого геоинформационного пространства города Москвы" - это еще один большой проект мэрии, решившей нанести на электронную карту все городские объекты, в том числе в виде полноценных панорам.

В-третьих, ИАС ДТОИВ подгружает и анализирует данные из СМИ и соцсетей. Раньше для этого использовались ресурсы компании "Медиалогия", но мэрия решила создать свой инструмент для анализа публикаций в интернете - сейчас это часть "системы управления информационными рисками аппарата мэра".

Как ДТОИВ использует весь этот массив данных? Из госконтрактов следует одна из ее задач - предупреждение возможного недовольства жителей новым строительством в своем районе, то есть выявление потенциальных конфликтов. Одна из задач ИС ДТОИВ - выявлять потенциальные конфликты, связанные с уплотнительной застройкой. Для этого в ДТОИВ есть весь набор данных: программа проводимых слушаний, в том числе по программе реновации, сводка по правонарушениям, в том числе связанным с акциями протеста, и полная выгрузка из медиа и социальных сетей по ключевым словам.

Если ДТОИВ направлена на решение узкопрофильных задач, то "система управления данными в распределенной вычислительной среде" (ИС УДРВС) может использоваться для очень разных целей - от медицины до анализа интернет-активности горожан.

Она анализирует все данные, содержащиеся в информационных системах и ресурсах мэрии, без их объединения в рамках одной платформы, объясняет руководитель IT-компании, сотрудничающий с ДИТом.

Такая форма более безопасна - данные не объединяются в один банк, просто пишется алгоритм, который знает, где их брать. Система работает по принципу машинного обучения, то есть сама учиться решать поставленную задачу.

Разработка ИС УДРВС началась в 2016 году, а уже в 2018-м она использовалась на практике. Например, для выявления "серой аренды" квартир - когда люди сдают свое жилье, но не платят налоги. В официальном отчете ДИТа за 2018 году этот механизм назван "Прогнозирование фактов в отношении аренды".

Для поиска "серых" квартир система анализировала информацию о регистрации людей, сотовые данные, данные о парковках, а также просматривала историю коммунальных платежей, платежей за детский сад и другие образовательные услуги, рассказывает бывший сотрудник мэрии.

В ДИТе изучали возможность подписания соглашений с несколькими банками для получения финансовой информации их клиентов, однако в итоге от проекта решили отказаться, говорит экс-сотрудник мэрии. С какими именно банками и почему договориться не удалось, он не уточнил.

Но примерное представление о финансовом положении каждого москвича у мэрии все равно есть. Во-первых, через городские ресурсы идут платежи за ЖКХ и другие госуслуги - более 6,6 млн транзакций на 19 млрд рублей в 2018 году. Во-вторых, власти города знают, какими квартирами и автомобилями владеют (или не владеют) горожане.

Международно – правовое регулирование защиты данных, полученных в ходе видеонаблюдения

28 января 1981 года, сорок лет назад, в Страсбурге был открыт для подписания первый имеющий обязательную силу международный договор, удовлетворяющий потребность в защите персональных данных – Конвенция Совета Европы о защите физических лиц при автоматизированной обработке персональных данных, также известная как «Конвенция 108» (ратифицирована в России ФЗ от 19 декабря 2005 года N 160 – ФЗ, вступила в силу для РФ 1 сентября 2013 года). Договор был модернизирован в 2018 году путем принятия Протокола о внесении изменений, который еще не вступил в силу. Протокол направлен на обеспечение того, чтобы принципы защиты персональных данных были адаптированы к новым технологиям, а также на укрепление предусмотренного конвенцией контрольного механизма.

В 1981 году «Конвенция 108», открытая для всех стран и обладающая уникальным потенциалом стать глобальным стандартом, закрепила основополагающие принципы и правила защиты данных, которые применяются и сегодня. Конвенция, составленная в нейтральном стиле с точки зрения технологий, полностью сохраняла свою актуальность на протяжении четырех десятилетий. На сегодняшний день она насчитывает 55 стран-участников на четырех континентах, еще 20 государств принимают участие в ее работе. Во многих государствах по всему миру «Конвенция 108» стала основой соответствующего национального законодательства. Кроме того, она послужила основой для первой директивы Европейского союза по защите данных, принятой в 1995 году, за которой в 2018 году последовало принятие Общего регламента по защите данных (GDPR).

Одной из целей протокола 2018 года, модернизирующего Конвенцию, является сведение воедино различных нормативных рамок, разработанных в разных регионах мира, в том числе в Европейском союзе, и предоставление гибкого, прозрачного и надежного многостороннего инструмента, призванного содействовать трансграничной передаче потока данных, обеспечивая эффективные гарантии от злоупотреблений, связанных с данными. Десять государств уже ратифицировали и 33 государства подписали протокол, создающий эту модернизированную «Конвенцию 108+». Совет Европы порекомендовал строгие правила, чтобы избежать значительных рисков для неприкосновенности частной жизни и защиты персональных данных, которые связаны с растущим использованием технологий распознавания лиц. Кроме того, некоторые приложения для распознавания лиц должны быть полностью запрещены, чтобы избежать дискриминации.

В январе 2021 года приняты новые  Руководящие принципы по распознаванию лиц, адресованные правительствам, законодателям и руководителям предприятий, правозащитная организация. Руководящие принципы были разработаны Консультативным комитетом по Конвенции о защите физических лиц при автоматизированной обработке персональных данных, который объединяет экспертов, представляющих 55 государств – участников Конвенции, а также 20 стран-наблюдателей.

Руководящие принципы предлагают запретить использование распознавания лиц, если это продиктовано лишь целью определения цвета кожи, религиозных или иных убеждений, пола, расового или этнического происхождения, возраста, состояния здоровья или социального статуса человека.

Запрет должен распространяться и на так называемые технологии распознавания эмоций, позволяющие по выражению лица определять личностные качества, внутренние ощущения, психическое состояние или уровень вовлеченности сотрудников в работу, поскольку эти  технологии  сопряжены с серьезными рисками в таких областях, как трудоустройство, доступ к страхованию и образованию.

Согласно новым руководящим принципам, при использовании технологий распознавания лиц в государственном секторе согласие, как правило, не должно быть правовым основанием, используемым для распознавания лиц государственными органами, учитывая дисбаланс полномочий между субъектами данных и государственными органами. По той же причине, как правило, это не должно быть правовым основанием, используемым для распознавания лиц, выполняемого частными лицами, уполномоченными выполнять аналогичные задачи, что и государственные органы.

Законность использования технологий распознавания лиц должна основываться на целях биометрической обработки, предусмотренных законом, и необходимых гарантиях, дополняющих Конвенцию 108+.

Законодатели и лица, принимающие решения, должны установить конкретные правила обработки биометрических данных с помощью технологий распознавания лиц в правоохранительных целях. Эти законы будут гарантировать, что такое использование должно быть строго необходимым и соразмерным для этих целей, и предписывать необходимые меры безопасности.

Обработка биометрических данных с помощью технологий распознавания лиц для целей идентификации в контролируемой или неконтролируемой среде, как правило, должна быть ограничена целями правоохранительных органов. Это должно выполняться исключительно компетентными органами в области безопасности. Законы могут предусматривать различные тесты на необходимость и соразмерность в зависимости от того, является ли цель проверкой или идентификацией, с учетом потенциальных рисков для основных прав и при условии, что изображения людей собираются на законных основаниях.

Для целей идентификации должны соблюдаться строгая необходимость и соразмерность как при создании базы данных (список наблюдения), так и при развертывании (в реальном времени) технологий распознавания лиц в неконтролируемой среде. Законы должны предусматривать четкие параметры и критерии, которым должны следовать правоохранительные органы при создании баз данных (списков наблюдения) для конкретных, законных и явных правоохранительных целей (например, подозрение на серьезные правонарушения или риск для общественной безопасности).

На этапе развертывания технологий распознавания лиц в режиме реального времени в неконтролируемых средах закон должен гарантировать, что правоохранительные органы продемонстрируют, что множество факторов, включая место и время развертывания этих технологий, оправдывают строгую необходимость и пропорциональность использования.

Понятие «контролируемая среда» охватывает случаи, когда биометрические системы могут использоваться только с участием человека.

Законы могут предусматривать различные тесты на необходимость и соразмерность в зависимости от того, является ли цель проверкой или идентификацией, учитывая потенциальные риски для основных прав и при условии, что изображения людей собираются на законных основаниях.

Законодатели и лица, принимающие решения, должны гарантировать, что ясная и точная правовая основа обеспечивает необходимые гарантии для обработки биометрических данных. Такая правовая основа будет включать строгую необходимость и соразмерность такого использования и будет учитывать уязвимость субъектов данных и характер среды, в которой эти технологии используются для целей проверки.

Использование технологий распознавания лиц частными организациями, за исключением частных лиц, уполномоченных выполнять аналогичные задачи, что и государственные органы, требует в соответствии со статьей 5 Конвенции 108+ явного, конкретного, бесплатного и информированного согласие субъектов данных, биометрические данные которых обрабатываются.

Учитывая требование о таком согласии субъектов данных, использование технологий распознавания лиц может иметь место только в контролируемых средах для проверки, аутентификации или категоризации. В зависимости от цели особое внимание следует уделять качеству явного согласия субъекта данных, когда оно является правовой основой для обработки.

Чтобы гарантировать, что согласие дано свободно, субъектам данных должны быть предложены альтернативные решения для использования технологий распознавания лиц (например, с использованием пароля или идентификационного бейджа), которые просты в использовании, поскольку, если оно окажется слишком длинным или сложным по сравнению с технологией распознавания лиц.

Если согласие дано для определенной цели, личные данные не должны обрабатываться способом, несовместимым с этой целью. Точно так же в случае раскрытия данных третьей стороне такое раскрытие также должно быть предметом специального согласия.

Частные организации не должны использовать технологии распознавания лиц в неконтролируемых средах, таких как торговые центры, особенно для идентификации лиц, представляющих интерес, в маркетинговых целях или в целях частной безопасности. Прохождение через среду, в которой используются технологии распознавания лиц, не может рассматриваться как явное согласие.

В соответствии со статьей 15 (3) Конвенции 108+, надзорные органы должны консультироваться по предложениям о любых законодательных или административных мерах, предполагающих обработку персональных данных с помощью технологий распознавания лиц. Необходимо систематически привлекать контролирующие органы и, в частности, консультироваться с ними по поводу любых возможных экспериментов или предполагаемого развертывания. Таким образом, с этими органами должны проводиться систематические консультации до запланированных проектов. Точно так же они должны иметь доступ к проведенным оценкам воздействия, а также ко всем аудитам, отчетам и анализу, проведенным в контексте таких экспериментов или проектов.

Законодатели и лица, принимающие решения, должны обеспечить эффективное сотрудничество между различными надзорными органами, компетентными в надзоре за различными аспектами обработки данных, когда разные органы несут ответственность за контроль соответствия такой обработки данных закону.

Определённые законодателем меры безопасности должны развиваться с течением времени и в ответ на меняющиеся угрозы и выявленные уязвимости. Они должны быть пропорциональны чувствительности данных, контексту, в котором используется конкретная технология распознавания лиц и ее целям, вероятности причинения вреда отдельным лицам и другим соответствующим факторам. Строгие методы хранения и утилизации - с помощью безопасных процедур - данных распознавания лиц с минимально возможными сроками хранения также способствуют снижению рисков безопасности.

Законодательные органы и лица, принимающие решения, должны использовать различные механизмы для обеспечения подотчетности разработчиков, производителей, поставщиков услуг или организаций, использующих эти технологии. Создание независимого и квалифицированного механизма сертификации для распознавания лиц и защиты данных, чтобы продемонстрировать полное соответствие выполняемых операций обработки, было бы важным элементом в укреплении доверия пользователей. Такая сертификация может быть реализована в соответствии с применением искусственного интеллекта, используемого технологией распознавания лиц: один тип сертификации для категоризации структур (разработка алгоритма, интеграция алгоритма и т. д.), а другой - для категоризации алгоритмов (компьютерное распознавание, интеллектуальный поиск, так далее.).

Осведомленность субъектов данных и понимание широкой общественностью технологий распознавания лиц и их влияния на основные права должны активно поддерживаться доступными и образовательными мероприятиями.

Идея состоит в том, чтобы предоставить доступ к простым концепциям, которые могли бы предупредить субъектов данных до того, как они решат использовать технологию распознавания лиц, чтобы понять, что значит использовать конфиденциальные данные, такие как биометрические данные, как работает распознавание лиц, и предупредить их о потенциальных возможностях. опасности, особенно в случае неправильного использования. Законодательные органы и лица, принимающие решения, должны способствовать участию общественности в разработке и использовании этих технологий и в обеспечении надлежащих гарантий для защиты основных прав, поставленных на карту, при использовании распознавания лиц.

Помимо проблем, изложенных в новых Руководящих принципах, важно учитывать и мировой опыт. Например, в Великобритании с 2012 года действует строгое законодательство, регулирующее работу с камерами уличного наблюдения, а также хранение и доступ к информации.

"Кодекс применения камер наблюдения" создан, по замыслу авторов, для того, чтобы соблюсти баланс между необходимостью вести наблюдение и невмешательством в частную жизнь.

Для России крайне актуальна борьба с «утечками» персональных данных из государственных и частных банков информации: данные из некоторых систем можно купить на так называемом рынке "пробива".

"Пробивом" на жаргоне называется покупка персональных данных, в основном на специализированных форумах в интернете с простой системой регистрации.  для покупки доступны информация из баз сотовых операторов, банков, МВД, ФНС и прочих государственных органов. Можно встретить предложения купить данные о парковочных сессиях, выписку из ЗАГСа или домовой книги, а также записи с любой видеокамеры.

Учитывая остроту восприятия в общественном сознании всех проблем, связанных с видеонаблюдением и персональными данными в целом, процессом распознавания и использования полученных результатов в правоприменительной и судебной деятельности, необходима адаптация международно – правовых требований и рекомендаций в нормативном регулировании этих вопросов для российских государственных органов и частных компаний.

Возможно потребуется и внесение изменений в российское законодательство, в том числе в Уголовно – процессуальный кодекс и в Федеральный закон об оперативно – розыскной деятельности.