Linked.Open.Data

Сайт инициативной группы
по развитию связанных данных (Linked Data)
для открытых Государственных данных РФ

Цель
1.Способствовать развитию концепции связанных данных
(linked data) в Государственных органах РФ с целью повышения эффективности работы с данными и анализа информации.

2.Популяризация технологических возможностей применения Семантик вэб (Semantic web) при построении информационных систем, работающих с Государственными данными.
Что такое связанные данные?
В данный момент времени каждый государственный орган формирует свои наборы открытых данных в уникальном формате и структуре. Что является крайне затруднительным для дальнейшей работы с этими данными, и особенно для сквозной аналитики агрегированных данных из различных государственных органов.

Концепция связанных данных подразумевает под собой бесшовную работу с данными из различных источников данных (баз данных), имеющих различную структуру и формат.

Использование связанных данных при построении информационных систем может стать эффективной цифровой платформой для "Открытого Правительства" и программы "Цифровой Экономики".
Зачем мы это делаем?
Потому что мы можем и хотим помочь.
Мы активно занимаемся развитием семантических технологий и делимся этим с российским IT сообществом. Мы выступаем на конференциях и семинарах, обучаем этому студентов и аспирантов.
Потому что мы в этом разбираемся и знаем как это делать.
Каждый из членов инициативной группы много лет занимается разработкой в области семантических технологий. Развивает собственные и заказные проекты. Помимо научной деятельности у нас есть опыт практического применения семантических технологий в промышленных коммерческих проектах.
Потому что у нас есть ресурсы, и мы много что уже сделали.
Применение семантических технологий для работы с данными - это один из самых очевидных путей развития систем по работе с Big Data. Этот путь уже заложен в карте развития информационных систем некоторых государственных органов.
Мы этот путь уже прошли и готовы делиться своим опытом и компетенцией, готовыми программными наработками и решениями.
Обоснование внедрения
Методические рекомендации по реализации принципов открытости в федеральных органах исполнительной власти.

УТВЕРЖДЕНЫ
протоколом заочного голосования Правительственной комиссии по координации деятельности открытого правительства от "26" декабря 2013 г. № АМ-П36-89пр

"Развитием работы по открытию государственных данных является постепенный переход к более перспективным моделям открытых данных - RDF (Resource Description Framework), а в последующем и к модели связанных данных (Linked data)"

Утвердить прилагаемую программу "Цифровая экономика Российской Федерации".

РАСПОРЯЖЕНИЕ
от "28" июля 2017 г. № 1632-р

Задача.
4.13. Обеспечить возможность использования данных в цифровых платформах

Веха.
4.13.1. Нормативно определены правила работы с данными, включая машиночитаемость данных, методы построения и расширения моделей данных, управление мастер-данными и метаданными, обеспечения семантической интероперабельности.

Срок.
IV квартал 2018 г.

Проделанная работа
Первое, что мы сделали, это на основании общедоступных данных Федеральной Налоговой Службы РФ (ЕГРЮЛ/ЕГРИП) разработали онтологию знаний, описывающую предметную область юридического лица, индивидуального предпринимателя и всех сущностей, связанных с ними.

Онтология необходима для контекстного описания всех данных, находящихся в выписках ЕГРЮЛ/ЕГРИП. А также, онтология описывает все связи и отношения между этими данными (сущностями).
Разработанная нами онтология лежит в свободном доступе на GitHub.
Данные
Мы преобразовали все открытые данные ФНС (ЕГРЮЛ/ЕГРИП)
в формат RDF-триплетов и сформировали единую графовую базу данных юридических лиц Российской федерации.

Полученная база данных содержит 2.4 млр. RDF-триплетов
(и постоянно увеличивается), что уже является одной из самых больших подобных баз данных в мире.
Для отображения и работы с данными, мы используем opensource платформу Ontodia, которая позволяет визуализировать и работать с данными в виде графа знаний (knowledge graph).
Пример коммерческой реализации подобного графа знаний, использующий данные ФНС РФ (ЕГРЮЛ/ЕГРИП).
Semantic web SPb
С нами крупнейшее в России профессиональное сообщество технических и научных специалистов в области семантических сетей.
Мы всегда на связи
Присоединяйтесь к нам!
+7 921 3456543
info@datafabric.cc
Санкт-Петербург, Лиговский проспект, дом 44В
Заполняя форму, вы соглашаетесь на обработку ваших персональных данных
Made on
Tilda