Минцифры приступает к разработке ГосДата.хаба — проекта по созданию национального озера данных, объединяющего потоки обезличенных данных госорганов. Об этом сообщается на сайте ведомства. Национальное озеро данных систематизирует хранение и обработку информации для государственных аналитических сервисов, упростит подготовку отчётов госорганам и бюджетным организациям, говорится в сообщении.
Все собранные данные будут попадать в озеро в обезличенном виде, их деперсонализация будет происходить на стороне поставщика данных, отметили в ведомстве. Реализация проекта намечена на 2022−2024 годы, а в опытную эксплуатацию система будет запущена в 2023 году.
Первоначально наборы данных, собранные в ГосДата.хабе, будут доступны для госорганов, подчеркнули в Минцифры. В перспективе доступ получит бизнес, для чего будет создан датамаркет — один из публичных контуров Национальной системы управления данными (НСУД).
Отмечается, что проект будет развиваться в трёх ключевых направлениях:
- переход от разрозненной отчётности государственных ведомств к автоматизированной интегрированной системе сбора обезличенных данных из государственных информационных систем;
- создание дата-сервисов и использование государственных данных для анализа состояния отраслей экономики и социальной сферы;
- предоставление обезличенных государственных данных бизнесу и гражданам, в первую очередь — разработчикам решений на основе искусственного интеллекта.
Основной площадкой реализации национального озера данных станет научно-исследовательский институт «Восход». По словам директора «Восхода» Максима Рымара, в рамках проекта будут сформированы бизнес-процессы по подключению поставщиков данных к аналитическому хранилищу, организован полный цикл сбора, обработки, нормализации данных и их использования для решения прикладных бизнес-задач.
Кроме того, запланировано развитие компетенций обработки больших данных внутри государственного сектора, а также методологическая поддержка разработки показателей и метрик на основе данных, подчеркнул Рымар.
Максут Шадаев, глава Минцифры:
ГосДата.хаб объединит обезличенные данные органов власти всех уровней и позволит формировать расширенную аналитику. В первую очередь запустим сервисы аналитики для ИТ и связи. Государство будет мотивировать бизнес предоставлять обезличенные данные по отдельным направлениям, которые критически важны для системы госуправления. Обмен данными будет двухсторонним: обезличенные данные государственных датасетов сможет использовать и бизнес для развития собственных решений.
В январе Правительство поручило Минцифры разработать план доступа бизнеса к дата-сетам (набору данных, размеченных так, чтобы их считывали нейронные сети) министерств и ведомств до 1 февраля. В конце 2021 года Шадаев отмечал, что создание единого государственного озера данных и запуск маркетплейса дата-сетов войдут в число приоритетных направлений работы министерства в 2022 году.