#4. Государственные домены, непрозрачная информатизация Москвы и открытость законотворчества
A government is a body of people: usually, notably, ungoverned. (c) Firefly
В дайджесте этой недели темами будут государственные домены и [не]прозрачность информатизации в Москве.
Государственные домены - это важный ресурс вне контроля и мониторинга, но необходимый для архивации данных и веб-сайтов. А непрозрачность информатизации в Москве - это как нельзя более актуальная тема на фоне новых инициатив по сбору данных ДИТ Москвы.
Государственные домены
Один из небольших проектов которым занимаюсь я лично, это ведение базы государственных доменов, доменов используемых органами власти, государственными учреждениями иными структурами для публикации официальной информации.
При изначальном проектировании база госдоменов у меня выглядела как это представлено на картинке выше, cейчас там гораздо больше понятий и объектов, например, это ASN блоки и типы хостинга используемых для госсайтов (коммерческие, частные и тд).
По объёмам это:
7536 доменов
181 корневой домен
44 информационные системы
163 сетевых блока и ASN
105 организаций
Основная моя личная цель для этого реестра - это формирование приоритетного списка для цифровой архивации официальных цифровых материалов в рамках Национального цифрового архива. Но, конечно это не единственная из возможных целей, этих целей вполне может быть много.
База госдоменов может использоваться для мониторинга доступности сайтов для граждан, для задач поиска данных (data discovery), для мониторинга работоспособности государственных информационных систем, для понимания актуального технологического стека публичного контура информационных систем и ещё многого другого.
Ранее эту базу лично я вел у себя локально в виде большого множества текстовых файлов в привязке к корневым доменам, сейчас вот уже давно реестр доменов можно взять в репозитории в Github, в который выложены скрипты и дампы данных которые формируются в проекте в Airtable. Это оказалось значительно удобнее благодаря тому что можно с помощью API Airtable запускать скрипты по сбору и обогащению собранных данных.
Эта база неполна, она хорошо охватывает сайты в домене .gov и 181 корневом домене (кроме .gov.ru это ещё и такие наиболее популярные корневые домены как: mvd.ru, sudrf.ru, msudrf.ru, izbirkom.ru и многие другие), но не охватывает сейчас региональные домены даже по крупным субъектам федерации и не охватывает все бюджетные учреждения и компании с госучастием, потому что это увеличит базу доменов до 150-250 тысяч записей. Только по органам власти там выходит около 21 тысячи доменов с учётом субъектов федерации и далее ещё есть муниципальные образования и тд. Но начинать правильно с крупнейших сайтов/доменов/цифровых ресурсов
До сих пор меня удивляет почему реестр официальных доменов органов власти не ведёт ни один орган власти. Единственный госпроект в этой области, Госмонитор, был довольно убогим всё время своего существования. В нём менее 400 доменов и эта база не то что неполна, они совершенно не соответствует реальному состоянию дел и не учитывает, ни суды, ни территориальные подразделения, ни сайты государственных информационных систем и ещё много чего.
Появится ли официальный реестр я не знаю, но свой реестр я в любом случае планирую развивать далее. По мере роста цифрового архива.
Непрозрачная информатизация Москвы
Много лет я пишу и говорю о том что информатизация в Москве одна из самых закрытых в нашей стране.
При довольно большом бюджете Москвы на ИТ (более 80 миллиардов в 2020 году) о самих информационных системах, базах данных, о том как они создаются практически нет общедоступной информации.
Например, почти во всех субъектах федерации в России есть реестры информационных ресурсов и систем. Иногда в них совсем немного информации, как в реестре Московской области, иногда в них есть открытые данные как во ФГИС КИ при общей закрытости, а иногда в них раскрываются сведения в невероятной детализации, как, например, в реестре ГИС Санкт-Петербурга. Чаще в средней детализации включающей сведения о расходах, НПА, операторе, сроке ввода в эксплуатацию и так далее. Например, так устроены реестр Самарской области и реестр Ленинградской области.
Но только в Москве реестр ГИС публикуется как PDF файл в котором есть только: наименование полное, наименование краткое и номер регистрации. Нет ни указания оператора, ни текущий статус системы, ни сведений о НПА определяющих создание и эксплуатацию этих систем ни многой другой информации.
В итоге если хочется найти сведения о этих ГИС, то надо “много рыть“ чтобы поднять все контракты на их создание, искать в НПА Москвы, о прозрачности которых отдельный разговор, многие Приказы ДИТ Москвы о создании ГИС не публикуются и так далее.
Иначе говоря - это невозможно было сделать случайно. Множество малых факторов подтверждают что Москве совершенно сознательно делают так чтобы любой внешний анализ их информатизации был значительно затруднен.
И это неудивительно, потому что когда начинаешь искать сведения, то по многим системам _вообще никакой информации нет_.
Именно по этой причине лично я считаю крайне опасными любые действия Мэрии Москвы по сбору данных на период COVID-19. ИТ системы Москвы крайне непрозрачны, мы не знаем как и куда будут использованы новые собранные данные, в каких системах они окажутся и как ими будут обмениваться.
Возможно ли открытое законотворчество
Ещё довольно давно, более 9 лет назад я пытался систематизировать существовавшие подходы к открытости законотворчества. Именно тогда было довольно много инициатив в этой области и, в России, и в мире, и всё развивалось очень оптимистично. Были эксперименты с публичными обсуждениями, с народной экспертизой законопроектов. Казалось что вот-вот и наконец-то появится что-то позволяющее если не делать законы лучше, то хотя бы не делать их хуже.
С тех пор прошло немало времени, в России появился портал regulation.gov.ru, скончался портал zakon.government.ru, практически полностью исчезла практика “народной экспертизы” нормативных-документов, до сих пор НПА публикуют в виде сканов, а сами госорганы не воспринимают НПА как основной свой продукт и не публикуют их как открытые данные, да и в части понятности официального языка, по личным моим ощущениям, становится только хуже.
А самое главное - это до сих пор ничего не сделано с “цифровой прослеживаемостью” НПА и конкретно законов.
Цифровой след всех кто “прикасался” к проекту закона фиксируется, в слабой форме, только в системе СОЗД Федерального собрания, там присутствуют сведения по отзывам депутатов, тех кто вносил законопроект и так далее. Но СОЗД не связано с regulation.gov.ru, а правовые системы pravo.gov.ru и pravo.minjust.ru не связаны ни с СОЗД, ни с regulation.gov.ru ни между собой и это ещё не говоря о плане законодательной деятельности Правительства РФ и так далее, сюда ещё довольно много всего можно добавить.
Самая главная проблема в том что, похоже, что на прозрачность НПА и вовлечение граждан нет спроса внутри государственного аппарата, а спрос со стороны граждан уже достаточно давно игнорируется.
В одной из следущих рассылках я вернусь к этой теме уже с обсуждением тезисами можно ли что-то в этой ситуации изменить.
Заметки
проведя небольшую инвентаризацию я сейчас вижу что мог бы написать если не книгу, то большую статью о том как запускать общественные технологические проекты. Потому что кроме Госзатрат, Открытых НКО и других проектов Инфокультуры и мини-проектов в виде открытого кода, есть десятки проектов которые не были закончены и десятки подготовленых ТЗ, видений проектов и многое другое. А также слишком много проектов созданных другими прошло перед глазами. Сроки их жизни и эволюция очень сильно отличаются от обычных проектов НКО.
хотя большая часть доходов бюджета, экономики страны у нас зависит от нефтегазового сектора, на удивление мало проектов по мониторингу его прозрачности. Как внутри страны, так и внешних. Как будто никому не интересно сколько нефтяные и газовые (да и другие ресурсные) компании выплачивают налогов, в бюджеты какого уровня, как устроена их собственная экономика и почему это касается каждого. Такая большая тема и словно выжженное интеллектуальное пространство. Что это - страх за свою жизнь, отсутствие интереса или сложность темы?
Ссылки
Data Commons - проект Google для сбора мировой, страновой, региональноый и кое-где муниципальной статистики. Сейчас интегрируется в их поиск
Regulatory technology - результаты анализа регуляторных технологий от The Productivity Commission of Australia. Объясняют само понятие и приводят многочисленные примеры.