Российская статистика: немашиночитаемая институциональная фрагментация
Если бы не было статистики, мы бы даже не подозревали о том, как хорошо мы работаем. (c) к.ф. "Служебный роман"
Я регулярно пишу про то как устроена работа с данными в мире, в частности в публикации статистики как дата продукта. При этом я старательно избегал разбора состояния российской статистики, о которой я могу, также рассказать немало, но жанр "позитивных примеров" (посмотрите как устроено у них) мне ближе чем жанр посмотрите как плохо. О плохих практиках я пишу реже и только когда они из ряда вон выходящие.
Но есть нечто про российскую статистику что стоит упомянуть по той причине что это подозреваю что это уникальное явление которое лично мне не встречалось ни в одной стране. Это явление институционализированная фрагментация данных.
Территориальные подразделения
Особенность российской системы государственного управления и, как следствие, особенность статистического учёта в том что у большинства российских федеральных служб, агенств и некоторых министерств есть территориальные органы/подразделения. Они есть у антимонопольной службы, у ФССП, у Ространснадзора, МВД России и ещё многих органов власти.
Несмотря на то что территориальные органы власти входят в структуру федерального органа исполнительной власти, они имеют собственные юридические лица, организационную структуру и собственные веб сайты.
В каких то случаях можно было бы говорить что территориальные подразделения оправданы, но, в целом, по мере развития цифровизации органов власти и у граждан, и у бизнеса, обязательно возникают вопросы о том зачем нужны территориальные подразделения кроме как быть продолжением федерального органа власти.
Некоторые госорганы, такие как ФНС России, де-факто, коммуницируют через единый сайт nalog.ru, где можно уточнить свой регион, но, в целом, это выглядит как прямая коммуникация с федеральной службой.
Территориальные подразделения есть и у Росстата, у каждого из которых есть отдельный сайт, который является поддоменом сайта rosstat.gov.ru с кодом региона, например, сайт Рязаньстата с кодом 62.
В чём отличие Росстата и его территориальных подразделений от других органов власти? В основном результатами, в отличие от других ФОИВов и иных органов власти, результаты работы статслужб - это данные статистики, собранные и представленные для пользователей.
Эти результаты публикуются, как на основном сайте службы, так и в её публичных и непубличных информационных системах, так и на сайтах территориальных органов власти.
Публикуется в разных форматах, разной структуре данных, в виде таблиц Excel, файлов MS Word, PDF документов или всё это вместе внутри ZIP и RAR архивов, но, что важнее, всё это нигде и никак не сведено вместе.
Всё это формирует ту самую российскую особенность официальной статистики - институциональную фрагментированность данных.
Институциональность заключается в том что эта фрагментация данных изначально заложена в модель существования стат службы в форме многочисленных “региональных феодов” публикующих данные по своей территории в разных формах, с разной детализацией, разной частотой, полнотой и доступностью.
Давайте я поясню, на практике.
Такие одинаковые и такие разные
Материалы которые публикуются на сайтах территориальных управлений Росстата частично унифицированы, в разделах официальной статистики в основном повторяются темы и данные более-менее схожи, хотя и не идентичны. Но когда речь заходит о статистических публикациях разница начинает проявляться весьма ярко.
К примеру, раздел статистических бюллетеней на сайте Рязаньстатса включает всего 3 типа публикации и возможность скачать их по годам. Это:
Социально-экономическое положение Рязанской области
Рязанская область в цифрах. Статистический сборник
Рязанская область. Статистический сборник
А если мы посмотрим на сайт Комистата то там появляется раздел с информацией по актуальным вопросам которых уже больше и которые шире, кроме того там же в других разделах публикуются аналогичные сборники что и в Рязаньстате.
Есть и более экзотические случаи когда вместе публикаций, на сайте размещается “каталог публикаций“, как это происходит в Ивановостате, а сами публикации необходимо запрашивать у этого территориального органа.
Заодно из этого каталога можно увидеть что территориальный орган готовит большое число статистических продуктов которые, по неизвестной причине, не размещаются ни на его сайте, ни на сайте Росстата.
Такие каталоги публикаций, которые можно заказать у территориальных органов, есть и, на сайте Мосстата, и на сайте Свердловскстата, и на сайте Амурстата и почти всех территориальных органов.
Территориальные органы власти активно торгуют статистическими публикациями, причём, всё в той же печатной или электронной форме документов.
А, кроме того, практически все они поставляют за деньги статистику региональным органам власти. Например, Ульяновскстат поставляет ежегодно статистику Минцифре Ульяновской области, а Якутстат выполняет работы для Минэкономики Якутии.
Далее в разных регионах по разному, однако не то чтобы эти доходы терр органов очень велики, они могут не превосходить 5 миллионов рублей в год и чем далее тем более будут снижаться. Потому что кому сейчас нужна статистика в виде PDF и документах MSWord? Только тем кто ей не пользуется на практике.
Итоговая ситуация выглядит так что публичные материалы Росстата рассеяны по его основному и территориальным сайтам, публикуются чаще всего в PDF и Excel файлах, а также существенная, но никем не измерянная до сих пор часть материалов доступны только за деньги через каталоги подписки на бумажные и электронные документы.
А как оно в мире?
Если кратко, то мне не удалось найти в мире ни одного схожего примера.
Да, во многих странах, особенно развивающихся данные до сих пор чаще публикуют отчетами и докладами, а не в виде машиночитаемых таблиц.
Во многих странах, особенно бедных африканских странах, статистика доступна только за деньги, кроме той за сбор которой платят международные организации и где за их счёт идет автоматизация статистического учёта.
Но нет ни одной страны с такой масштабной фрагментацией статистических продуктов, ещё и введенных в систему территориальных органов.
Ни среди стран столь же территориально распределённых, таких как Канада, их статистическая служба весьма компактна. Ни в Бразилии, где статистика в ведении Института географии и статистики. Ни в статистической службы Индонезии, сравнимой с РФ как по числу граждан, так и по размеру территории.
—
Этот текст, к сожалению, без финального вывода. Состояние официальной статистики в России довольно удручающе. Я не останавливался в этот раз на проблемах несопоставимости данных, отсутствия статистики за десятилетия, исчезновении исторических статсборников, отсутствия машиночитаемых данных, устаревших информационных системах и полном отсутствии методов сбора альтернативых данных и экспериментальной статистики. Эти проблемы, также, никуда не исчезли. Но они не уникальны. А вот это территориальное дробление статучёта - это исключительно российская специфика и, чем далее, тем более, представляющаяся весьма сомнительной.
#statistics #russia #data #openata