#1. Размышления конца сентября 2020. Будущее государственного и общественного аудита и контроля, обнаружение данных и многое другое
Будущее государственного контроля и аудита, обнаружение и доставка данных и цифровая архивация
После довольно долгих размышлений, я, всё таки, решил активировать Substack и использовать этот формат для регулярных больших заметок и рассуждение на темы о которых думаю давно. Substack - это формат для больших текстов, с некоторой рефлексией и не обязательно завершёнными размышлениями, но с некоторой их зрелостью. Это будет сильно отличаться от моего канала в телеграм и от личного блога. Как и во всех текстах основанных на профессиональной и иногда личной рефлексии, здесь я не буду претендовать на точность мысли, но буду вкладывать в написанной столько последовательности сколько смогу.
Будущее государственного контроля и аудита
Очень многие современные механизмы государственного контроля устарели, а вернее не менялись, столь же давно как и методы государственного управления. Они собраны вокруг понятных, измеримых “продуктов” деятельности органов власти и бюджетных учреждений и вокруг не менее понятных объектов и субъектов учёта.
Причём в основном это довольно давно существующие понятия, самые очевидные это: законы, приказы, постановления, другие НПА, бюджеты, госпрограммы, контракты, субсидии, договора, трудовые договора, госзадания, а также сопоставление планов и фактов, отчетных документов и запланированных мероприятий и так далее. В большей степени, эта деятельность мало изменилась за десятилетия если не за столетия. Но это не означает что изменения невозможны, больше технологий дают возможность большего числа инструментов контроля. А новые продукты и процессы внутри государств требуют новых механизмов наблюдения за ними.
Какие новые продукты создаются органами власти? Это в первую очередь ИТ продукты такие как: государственные информационные системы, базы данных, веб-сайты, мобильные приложения, ПО созданное по заказу государства. Список этот не исчерпывающий, но, безусловно, новые продукты можно измерять новыми методами и технологиями, помимо оценки и сопоставления запланированного и результата и оценки стоимости достижения этого результата.
Если посмотреть на некоторые институционализированные планы (стратегии) сформированные разными частями государства то возникает много старых и новых вопросов:
Правильно ли сформулированы цели?
Измеримы ли они?
Правильными ли методами осуществляется их реализация?
Возможно ли нанесения ущерба и какого, при их реализации?
Нарушаются ли права других лиц и кто может пострадать/пострадал при их реализации?
При разработке одного из видов продукции органов власти, нормативно-правовых актов, есть такая процедура как оценка регулирующего воздействия. Но к другим действиям и продуктам такая оценка не производится. С одной стороны кто-то скажет что свой документ НПА должен быть на всё и поэтому текущая ситуация полна и достаточна анализом документов, но проблема в том что документы НПА не покрывают всех проблем и задач. Огромное число решений проходит за их пределом или внутри пространств создаваемых НПА широкого действия.
Лично у меня складывается ощущение что таких принципиальных вопросов ещё никто не ставит. А государственный контроль постепенно развивается в сторону оперативного технологического контроля: контроль за транзакциями в реальном времени, использование интернета-вещений, использование спутникового и иного неразрушающего мониторинга.
Но даже в этом всё непросто. Например, в России контроль качества результатов организован гораздо хуже чем контроль формальных процедур в госзакупках. Но об этом в следующий раз, это большая и непростая тема.
Обнаружение данных (data discovery) и доставка данных (data delivery)
Больше открывать новых данных или лучше использовать то что уже опубликовано? Всё больше проектов создающих добавленную стоимость ранее опубликованных и публикуемых открытых данных и всё более развиваются технологии того как лучше их обнаруживать и обрабатывать.
О проблемах поиска данных, доставки данных часто забывают на фоне других проблем: полноты, качества и существования данных в принципе. Но эти проблемы есть и есть попытки их решения.
Из любопытных проектов последнего времени QRI и Splitgraph. В обоих по своему решается проблема обнаружение и доставки данных. Splitgraph собирает их в базу PostgreSQL к которой есть дистанционный доступ и QRI даёт возможность упаковывать их в пакеты данных и работает как Git-for-Data. В этом изменение подхода к доставке данных и некоторые попытки решения проблемы поиска данных за счёт того что проекты индексируют наиболее крупные источники данных. Также работает и data.world предоставляя более удобный интерфейс к данным которые уже опубликованы>
С обнаружением данных, в принципе, много сложностей. Поиск Google Dataset search даёт скорее плохие результаты чем хорошие, в основном из за того что индексирование данных возложено на умные HTML теги и приводят к тем же манипуляциям поисковой выдачи что и во всех остальных случаях. А поиск от DataCite дает много ошибочных срабатываний поскольку индексирует не только данные, но и просто научные статьи.
Не исключено что задача обнаружения данных не имеет простого решения, но можно хотя бы улучшить имеющиеся попытки её решить,
Цифровая архивация
Печально признавать что долгосрочная архивация современной цифровой истории в России может быть объектом хобби, но не может быть работой. Причина этого в отсутствии заказчиков в любой форме, общественных, политических, экономических и в явном дефиците людей заинтересованных в сохранении именно новейшей истории.
При этом такие архивы всем нужны постфактум, когда данные уже потеряны и не вернуть. Например, когда какой-то значимый вебсайт исчезает или заканчивается мега событие такое как олимпиада и начинают исчезать все связанные с ним веб-сайты и отдельные страницы. До этого момента нет тех кто готов тратить на них деньги или другие ресурсы.
Не считая интернет-архива Archive.org большая инициатив по архивации современной истории в мире осуществляется государственными организациями, национальными библиотеками и архивами. Для многих это сохранение их культурного наследия, особенно когда есть ощущение дефицита публикаций на национальном языке.
Архивное дело в России, к сожалению, замерло как минимум лет на 30, с завершением СССР. Современные технологии используются, в основном, для оцифровки материалов и накопленных за советские годы и ранее. При этом сотрудники архивов работают “охранниками архивов“, кое-где взимая по 120 рублей за сканированную страницу и большие деньги для доступ к фото и видео материалам.
Все кто сталкивался с этой стороной архивов не без оснований считаю тему архивации и непривлекательной. Как создать потребителя? Как сделать сервисы архивации востребованными? Как создать среду заинтересованности в сохранении новейшей истории? Вот в чем вопрос ответ на который мне так и не удалось найти в существующих проектах.
Заметки
Заметки за сентябрь, в дальнейшем они накопительным итогом будут собраны на одной странице у меня на сайте (я подсмотрел такой подход у Nadia Eghbal и вижу его логику):
мне очень нравится формат подачи курсов на платформе Quantic, она достаточно простая и пройдя там курсы по основам стартапом и по стратегии голубого океана, я вижу только один недостаток такого формата, отсутствие финального списка рекомендаций для чтения и материалов для закрепления знаний. При этом сам интерактивный формат курсов один из лучших по простоте и запоминанию.
не покидает мысль что проекты общественного контроля/надзора/внимания поддаются довольно чёткой систематизации и методологии. Для них можно разработать аналог lean canvas используемого в стартапах. Ключевое ограничение - это дефицит источников финансирования и, то что подобные проекты требуют одновременно технологических знаний и некоторой зрелости авторов в осознании проблемной области к которой общественное внимание привлекается.
Ссылки
Книга Стивена Вольфрама A New Kind Of Science у меня идет первой в списке планов на чтение.
Книга Nadia Eghbal Working in Public: The Making and Maintenance of Open Source Software об устройстве сообществ открытого кода.
Atlas of Surveillance проект по слежке за теми кто следит от Electronic Frontier Foundation.