MAGAZÍN EGOVERNMENT 2/2022
MODELOVÁNÍM AGEND K VYŠŠÍ KVALITĚ ÚDAJŮ VEŘEJNÉ SPRÁVY
Programové prohlášení vlády ČR se poměrně výrazně věnuje problematice e-governmentu a digitalizaci veřejné správy a slibuje v této oblasti významné posuny vpřed. Důležitým prvkem e-governmentu jsou údaje (data) spravované veřejnou správou a jsou jim také explicitně věnovány některé body v prohlášení vlády, jako například:
- důsledně budeme vymáhat, aby mezi úřady obíhala data, nikoli občan. Pokud občan státu data jednou poskytne, už je po něm stát nesmí znovu vyžadovat;
- zrychlíme proces otevírání dat (open data) a aktualizace otevřených dat na všech úřadech veřejné správy;
- otevřeme data komerčnímu i neziskovému sektoru a přizveme je, aby se tak podílely na rychlejším rozvoji digitálních služeb veřejné správy a privátního sektoru.
Problematice dat a údajů veřejné správy je věnován následující text.
Legislativa definuje a vymezuje agendy jako právní rámce pro fungování orgánů veřejné moci v dané oblasti, definuje související procesy a činnosti spojené s jejich výkonem a vymezuje rozsah evidovaných, spravovaných a využívaných údajů pro jejich výkon. Každý konkrétní zákon legislativně vymezuje konkrétní agendu veřejné správy, určuje její konkrétní prováděné činnosti (procesy) a vymezuje nezbytné údaje pro její provádění. Správnost a přesnost každé prováděné agendy je závislá na přesnosti její definice v zákoně. Z pohledu definovaných činností pro výkon agendy se nejedná o zásadní problém, zcela odlišná situace je ale v oblasti údajů, jejich názvů a jejich významů. Údaje spravované v agendě jsou odvozeny od pojmů, jejichž významy jsou s větší či menší přesností definovány souvisejícím zákonem. Celá situace je ale komplikovaná faktem, že pojmy (respektive jejich názvy) jsou sdíleny napříč veškerou legislativou (odlišnými doménami), a tak není výjimkou, že jejich konzistence z pohledu věcného významu bývá nedostatečná.
Z těchto důvodů existují pro tvorbu legislativy doporučené zásady (např. „Metodická pomůcka pro přípravu návrhů právních předpisů“ vydaná odborem vládní legislativy Úřadu vlády v roce 2006), avšak k jejich nedodržování dochází poměrně často.
Pro ukázku vybíráme několik zásad souvisejících s pojmy, a tedy návazně i s odpovídajícími údaji agend:
- pojem je nutné vymezit srozumitelně a jednoznačně a vyhnout se současně definici nevhodné až směšné;
- v rámci určité části právního předpisu, např. dílu, nelze upravovat nový pojem pouze pro účely této části;
- je nežádoucí, aby pojem, kterému je obecně přisuzován určitý obsah, byl pro účely různých zákonů vymezen různě (zásada stálosti pojmosloví).
Příklad nejednoznačně definovaného pojmu v legislativě (nedodržení zásady stálosti pojmosloví) – pojem „budova".
- V zákoně č. 256/2013 Sb., o katastru nemovitostí je definována jako „nadzemní stavba spojená se zemí pevným základem, která je prostorově soustředěna a navenek převážně uzavřena obvodovými stěnami a střešní konstrukcí".
- V zákoně č. 406/2000 Sb., o hospodaření energií je definována jako „nadzemní stavba a její podzemní části, prostorově soustředěná a navenek převážně uzavřená obvodovými stěnami a střešní konstrukcí, v níž se používá energie k úpravě vnitřního prostředí za účelem vytápění nebo chlazení".
Význam budovy se v kontextu obou zákonů liší a skutečný a přesný význam pojmů je dán až jejich celým slovně vyjádřeným kontextem. Název samotného pojmu je nejednoznačný. V rámci jednoho zákona (jedné agendy) to nemusí být problém, avšak veřejná správa je tvořena množstvím agend, které pojmy (a údaje) navzájem sdílejí a využívají je při jejich výkonu.
Podobných nejednoznačně definovaných pojmů existuje celá řada a očekávat rychlou nápravu těchto nedostatků v legislativě není příliš reálné.
Potřeba jednoznačnosti významu pojmů (údajů) ve veřejné správě se zvyšuje s úsilím při budování e-governmentu. Příkladem může být aktuální znění § 5 zákona č. 111/2009 Sb., o základních registrech. Vedle stávající povinnosti veřejné správy využívat referenční údaje ze základních registrů jako závazné, zavádí zákon tuto povinnost také pro využívání sdílených údajů z agendových informačních systémů napříč agendami veřejné správy. Pro sdílení údajů agendových informačních systémů je určen Propojený datový fond (PPDF) a nově také Veřejný datový fond (VDF), který je vytvářen na principu otevřených dat. Otevřená data jsou určena k obecnému využití, a explicitně definovaný jednoznačný význam jejich jednotlivých publikovaných údajů je proto nezbytný. Efektivním vyjádřením významu jednotlivých údajů je zachycení jejich kontextu v datových specifikacích, například formou konceptuálních modelů.
Veřejná správa je z informatického pohledu značně distribuované heterogenní prostředí vyskytující se ve významově rozličných oblastech (doménách), které sdílení a výměnu informací komplikuje. Informační architektura veřejné správy proto řeší složité sdílení údajů centrálním místem, které má za úkol evidovat a spravovat informace o všech subjektech práva (v agendě vystupují v agendových rolích – kontextech) a objektech práva (jsou předmětem práv nebo povinností subjektů práva), jejich údajích (atributech), datových strukturách a souvisejících legislativních ustanoveních. Na základě evidovaných informací o údajích VS následně umožňuje a zprostředkovává sdílení a přístup k údajům napříč všemi agendami. K tomuto účelu je určen jeden ze základních registrů – registr práv a povinností (RPP), který by měl na základě § 51 (6) zákona č. 111/2009 Sb. obsahovat informace o každé agendě veřejné správy, o údajích všech subjektů a objektů práva spravovaných každou agendou, a také o jejich atributech.
K zajištění správné funkcionality sdílení a přístupu k údajům VS je nezbytné, aby informace evidované o nich v RPP byly úplné, významově správně popsané a aby v RPP byly evidovány všechny údaje všech agend.
Reálný stav informací vedených v RPP (srpen 2022) je ale následující:
- registrováno 446 agend 30 ohlašovateli;
- pouze u 61 agend jsou uvedeny nějaké údaje (zahrnuty i agendy pouze s jedním údajem) dle § 51 (6) zákona č. 111/2009 Sb., což představuje pouze 14 % všech ohlášených agend;
- evidováno celkem 214 subjektů a objektů práva s 1637 evidovanými atributy (údaji).
Základní nedostatky a chyby při registraci agend:
- nejsou identifikovány a evidovány všechny subjekty a objekty práva (entity) v agendách dle znění příslušné legislativy;
- častá špatná identifikace entit (nejsou uváděny entity předmětné domény, ale pojmy, které nejsou subjektem ani objektem práva, jako „evidence“, „registr“, různé činnosti apod.);
- schází detailní výčet údajů entit (86 % agend nemá uvedeny žádné údaje).
Stávající stav evidence údajů v RPP je zcela neuspokojivý a neposkytuje dostatečný základ pro sdílení údajů agend dle § 5 zákona č. 111/2009 Sb., o základních registrech. Světlou výjimku představují pouze základní registry a jejich sdílené údaje.
Neúplnosti registrace agend a nejednoznačnostem v definicích pojmů je možné účinným způsobem předcházet sémantickým modelováním legislativy a agend.
Pro zachycení významu pojmů v kontextu daného dokumentu nebo domény je využíván „Sémantický slovník pojmů“. Ten sdružuje slovníky na různých úrovních, od základního slovníku (Z-SGov – obsahuje především pojmy pro popis ostatních slovníků) přes slovník veřejné správy (V-SGov), který obsahuje pojmy používané napříč veřejnou správu, až po slovníky popisující konkrétní agendy, datové sady a dokumenty.
Každý jednotlivý slovník je tvořen:
- tezaurem (glosářem), který definuje důležité pojmy v dané oblasti zájmu, např. pojmy zavedené nějakým zákonem nebo pojmy používané v nějaké agendě;
- konceptuálním modelem – znalostním grafem, který pojmy z tezauru vzájemně propojuje pomocí významových (sémantických) souvislostí.
Sémantický slovník pojmů veřejné správy (SGoV) se tak stává prostředkem pro postupnou harmonizaci významu (sémantiky) dat vedených v informačních systémech veřejné správy (ISVS). Lze ho chápat jako katalog pojmosloví používaného v rámci veřejné správy, zahrnující pojmy, jejich definice, vazby pojmů na legislativu, vzájemné významové vazby pojmů mezi sebou i významové vazby pojmů na standardní veřejné slovníky používané v zahraničí (především z iniciativy EU, např. ISA Core Vocabularies). Významová vazba označuje souvislost mezi pojmy, která má určitý konkrétní definovaný význam.
Publikovanou ukázku sémantického slovníku pojmů veřejné správy lze získat prostřednictvím odkazu https://slovník.gov.cz/.
Následující obrázek zachycuje zjednodušený rámec tvorby i využití sémantického slovníku.
Proces tvorby sémantického slovníku se skládá z doporučených kroků, které jsou znázorněny na obrázku odstíny žluté. Odstíny zelené zobrazují návazné části procesu, které využívají výsledky konceptuálního modelování například pro tvorbu datových schémat, nebo formulářů určených pro zadávání a sběr dat.
Samotnou tvorbu sémantického slovníku lze tedy popsat několika následujícími kroky:
- doménový odborník (znalec věcné problematiky) shromáždí dokumenty, které obsahují relevantní terminologii (např. legislativu);
- sestaví a publikuje pojmový glosář (tesaurus);
- datový architekt sestaví konceptuální model;
- publikuje sémantický slovník k obecnému využití.
Vytvořené sémantické slovníky (tezaury a konceptuální modely) nabízejí široké využití:
- získání podkladů pro kvalitní a úplnou evidenci údajů subjektů a objektů práva při ohlašování agendy v registru práv a povinností, včetně jejich významů s odkazy na legislativu a identifikovanými významovými vazbami mezi pojmy;
- automatické generování datových schémat otevřených dat, nebo datových rozhraní ISVS či kontextů ISSS pro potřeby PPDF;
- usnadnění návrhu formulářů dle datového schématu pro zadávání dat;
- snadnou komunikaci prostřednictvím diagramů;
- automatické vytváření výkladových slovníků;
- vyhledávání vzájemných významových souvislostí mezi datovými sadami, schématy a rozhraními (funkční nadstavba nad Katalogem otevřených dat NKOD).
Problematika modelování agend a kvalita evidovaných informací v RPP je součástí projektu „Rozvoj datových politik v oblasti zlepšování kvality a interoperability dat veřejné správy“, CZ.03.4.74/0.0/0.0/15_025/0013983. V jeho rámci vznikly pro tyto oblasti ucelené metodiky a podpůrné nástroje, podpořené vzdělávacími aktivitami a školeními. Jedná se zejména o:
- metodiku pro definici údajů vedených v agendě;
- metodiku tvorby a údržby sémantického slovníku pojmů veřejné správy;
- výrobní linku s podpůrnými nástroji pro tvorbu a údržbu konceptuálních modelů;
- školení „Modelování významu dat ve veřejné správě".
Konkrétní informace jsou dostupné na Portálu otevřených dat (data.gov.cz).
Modelování agend (tvorba a správa sémantických slovníků) představuje optimální způsob zajištění sémantické interoperability dat v prostředí veřejné správy. Má navíc potenciál výrazně ovlivnit kvalitu údajů veřejné správy, jejich evidenci, správu, jejich sdílení a všeobecné využití, a tak výrazně přispět k budování e-governmentu ČR v duchu deklarací zveřejněných v prohlášení vlády ČR.
Autor: Drahomír Chocholatý
Tento článek vznikl v rámci projektu „Rozvoj datových politik v oblasti zlepšování kvality a interoperability dat veřejné správy“ OPZ č. CZ.03.4.74/0.0/0.0/15_025/0013983, který zastřešuje odbor hlavního architekta eGovernmentu, Ministerstvo vnitra ČR.