Úvod do otevřených dat

Zásady Mezinárodní charty otevřených dat:

1.    Otevřenost jako standard (Open by default) – automatické zveřejňování všech dat až na určité výjimky, například z důvodu bezpečnosti, ochrany osobních údajů, ochrany autorských práv, …

2.    Včasnost a ucelenost dat (Timely and Comprehensive) – důraz na relevantnost dat, tj. měla by být poskytnuta včasně, ucelená, přesná, vysoké kvality, původní a nemodifikovaná.

3.    Přístupnost a použitelnost (Accessible and Usable) - strojová čitelnost dat, jejich snadná dostupnost, poskytovaní zdarma na základě otevřených licencí.

4.    Srovnatelnost a interoperabilita (Comparable and Interoperable) - zajištění snadného vzájemného srovnání a interoperability dat, nutnost dodržování odsouhlasených datových standardů.

5.    Zaměření na zlepšení vládnutí a zapojení občanů (For Improved Governance and Citizen Engagement) - zvyšování transparentnosti veřejné správy a zapojení se občanů do správy věcí veřejných.

6.    Zaměření na inkluzivní rozvoj a inovace (For Inclusive Development and Innovation) - přinášet výhody a přínosy všem uživatelům, veřejnému sektoru, privátnímu sektoru a celé společnosti.

Významnou roli v konceptu e-governmentu a otevřeného vládnutí sehrávají otevřená data, jejichž principy a technické standardy výrazně usnadňují přístup k veřejně přístupným informacím, podporují jejich strojové zpracování a zejména jejich opakované používání a zhodnocování. Nejedná se o pouhé využití nových technologických možností, ale především o komplexnější přístup k informacím veřejné správy vyplývající z celosvětového fenoménu „otevřenost“. Výchozí koncept a také první principy otevřených dat byly formulovány již v prosinci 2007 v kalifornském Sebastopolu zastánci otevřeného vládnutí a v roce 2015 byly upřesněny a zkoncentrovány do zásad v „Mezinárodní chartě otevřených dat“, včetně shrnující definice pojmu „otevřená data“.

Otevřená data jsou digitální data, která jsou k dispozici s technickými a právními charakteristikami nezbytnými k tomu, aby byla volně používána, opětovně používána a distribuována kýmkoli, kdykoli a kdekoli.“

Definice ve spojení se zásadami je dostatečně vysvětlující, přesto si ale některé oblasti problematiky otevřených dat zaslouží pár upřesňujících informací, aby nedocházelo k nevhodným výkladům, nesprávným implementacím a znehodnocení jejich potenciálu.

Otevřenost – „každý má právo podílet se na správě věcí veřejných“

Otevřenost je zastřešujícím konceptem nebo filozofií, která se vyznačuje důrazem na transparentnost a spolupráci a je základem dnešního pojetí světa.

Otevřená data vycházejí z konceptu „otevřenosti“ a v podmínkách veřejné správy se tato otevřenost vyskytuje ve dvou podobách. Jedná se o otevřenost právní a otevřenost technickou.

Právní otevřenost je zaměřena na legalizaci získávání dat, ustavení možností jejich sdílení, šíření a možností jejich následného zužitkování. Jedná se o odstranění legislativních bariér zpřístupnění informací spravovaných veřejnou správou a současně o ošetření těch informací, které souvisejí s ochranou osobních údajů, obchodního tajemství, bezpečnosti státu a ochranou autorských práv.

V ČR byla otevřená data legalizována a zavedena do legislativy novelou zákona č. 106/1999 Sb., o svobodném přístupu k informacím. Zákon v §3 zavádí do legislativního prostředí klíčové pojmy v oblasti otevřených dat - strojově čitelný formát, otevřený formát, otevřenou formální normu, metadata a také definuje otevřená data v kontextu veřejné správy ČR:

 „Otevřenými daty se pro účely tohoto zákona rozumí informace zveřejňované způsobem umožňujícím dálkový přístup v otevřeném a strojově čitelném formátu, jejichž způsob ani účel následného využití není omezen a které jsou evidovány v Národním katalogu otevřených dat.“

Technická otevřenost je zaměřena na odstranění technických překážek spojených s publikací a používáním otevřených dat, což vyžaduje standardizaci především již samotné publikace dat, standardizaci používaných otevřených formátů, doprovodné dokumentace, zajištění kvality, dostupnosti a způsobu dohledání publikovaných dat. Zákon č. 106/1999 Sb. ve smyslu § 3 odst. 9 řešení této oblasti usnadňuje definicí pojmu „Otevřená formální norma“, což je legislativní nástroj pro stanovení technických doporučení (standardů) s cílem zajištění, že stejná data publikovaná různými poskytovateli budou technicky otevřená a interoperabilní a pro poskytovatele otevřených dat jsou dle § 4b odst. 1 závazná.

Práce s daty a informacemi – základ kvality dat

Data a informace jsou často vzájemně zaměňována a považována za synonyma. Základní rozdíl mezi daty a informacemi spočívá v tom, že informace mají konkrétní specifický význam (daný okolním kontextem), data samotná jsou bez významu a slouží k formalizaci informací do podoby vhodné ke strojovému zpracování.

Problém objasňuje následující obrázek 1, který je vytvořen na základě podkladu publikovaném v normě ISO/IEC 2382-1.

práce s daty a informacemi

Obrázek 1

Z uvedeného obrázku je zřejmé, že informace jsou poznatky o konkrétním objektu vymezené specifickým kontextem (zachycené souvislosti na jiné objekty v rámci řešené domény). Význam kontextu lze jednoduše demonstrovat na příkladu pojmu škola. Ta se může vyskytovat v různých kontextech: škola jako nemovitost, škola jako vzdělávací instituce, škola jako zaměstnavatel atd. Je zcela zřejmé, že každému specifickému kontextu budou odpovídat jiná související data a vazby na jiné informace.

Pro strojové zpracování informací je nutná jejich vhodná reprezentace v rámci které jsou převedeny na data a následně je možné i jejich technologické zaznamenání, vhodné pro další zpracování a využívání. Navazujícím zpracováním dat dojde k vytvoření nových dat, jejich interpretaci (přiřazení významu) a vytvoření nové informace (nový poznatek). Tento způsob práce s informacemi je typický pro klasické informační systémy, které mají tu výhodu, že jejich celkový kontext je daný datovým modelem, který je neměnný a trvale známý všem částem i uživatelům informačního systému. Z tohoto důvodu jsou reprezentace informací, stejně jako interpretace dat snadné, neboť celkový kontext informací je uzamčený v uceleném informačním systému.

V případě otevřených dat je způsob práce s informacemi téměř stejný, pouze s tím rozdílem, že ke zpracování otevřených dat dochází obvykle mimo původní informační systémy, ze kterých byla data publikována (v obrázku odlišeno barevně: žlutá oblast – publikace dat z různých IS, zelená oblast – zpracování a interpretace dat v jiných systémech a aplikacích). Aby bylo vůbec možné s publikovanými otevřenými daty pracovat, je nutné k publikovaným datům přidat informace o jejich významu a v jakém kontextu jsou používána. Prakticky to znamená publikovat s daty také jejich kontext (datové schéma, správně navržený a zdokumentovaný konceptuální model) a související metadata.

Práce s kontexty – používání a zhodnocování otevřených dat

Používání a zhodnocování dat je základním cílem a smyslem otevřených dat. Možnosti jejich využití jsou rozmanité. V nejjednodušším případě se může jednat o pouhou prezentaci dat za účelem jejich zpřístupnění, zobrazení a podpory transparentnosti široké veřejnosti. Při náročnějších využitích půjde o spojování datových sad, hledání nových souvislostí (kontextů) a vytěžování nových poznatků, nebo v případě mobilních aplikací vytváření komplexnějších informací podporujících komfort jejich uživatelů – veřejnosti.

V případě interního využití veřejnou správou mohou otevřená data vyplnit stávající mezery ve sdílení dat jednotlivými organizacemi VS v těch případech, které agendové systémy neřeší, nebo jejichž vzájemná komunikace není součástí sběrnice eGon Service Bus. Příkladem takových mezer jsou například číselníky.

Obrázky níže uvádějí příklad zhodnocení dat pomocí propojení dvou datových sad.

Význam informací v datové sadě „sportoviště“ je vyjádřen jejím konceptuálním modelem „Kontext 2“. Model zachycuje základní objekt (entitu) „sportoviště“ s jejími základními vlastnostmi (atributy) – iri, název, popis, podmínky užívání, provozní řád. Zbývající důležité informace jsou vyjádřeny vazbami na jiné entity, které jsou jejich zdrojem, jako např. provozovatel, vlastník, umístění apod. Model vymezuje specifický kontext informací o sportovišti a tím určuje i význam a smysl jednotlivých informací.

Obdobným způsobem je vyjádřena i druhá datová sada „akce“ pomocí „Kontextu 1“.

kontext

Obrázek 2

Při prohlídce obou kontextů je poměrně snadné zjistit, že obě datové sady jsou vzájemně propojeny entitami „umístění“ a „člověk či osoba” a že se tedy nabízí datové sady propojit a vytvořit tak zcela nový kontext „sportovní akce“ – obrázek 3.

Propojeným datovým sadám bude odpovídat nový datový model a interpretace dat i jejich vytěžování získá nový rozměr. Sdělované informace mohou být mnohem obsáhlejší a kladené otázky mohou být složitější a komplexnější - například: „Jak souvisí poskytování sponzorství (nebo mediální partnerství) u jednotlivých typů akcí s místem konání (hraje roli vazba na vlastníky a provozovatele?)”. Názorná ukázka uvádí, že transparentnost není jenom o otevřenosti dat, ale také o možnostech dalšího (strojového) zpracování a jejich kvality.

nový kontext

Obrázek 3

Způsoby vytváření nových kontextů jsou omezeny pouze kvalitou publikovaných dat a kvalitou jejich popisu. Z použitých kontextů také vyplývá, že některé navázané entity jsou typu číselníků a v takových případech není vhodné vytvářet nové vlastní číselníky ani je nahrazovat konkrétními údaji, ale vždy odkazovat na číselníky již publikované jako samostatné datové sady – obrázek 4 (další rozšíření výsledného kontextu informací).

číselník

Obrázek 4

Otevřená data a EU

Pro úplnost popisu konceptu otevřených dat je nutné ještě zmínit pojem „interoperabilita“ v rámci EU. Z pohledu otevřených dat se jedná o důležitý aspekt, neboť mezi cíle EU patří vytvoření jednotného digitálního trhu pro podporu a rozvoj hospodářského prostředí, zajištění interoperability evropských veřejných služeb usnadňující komunikaci občanů EU s veřejnou správou a vybudování sdíleného datového prostoru pro podporu inovací, vývoje a výzkumu.

Požadavky na zajištění interoperability v rámci EU jsou definovány pomocí European Interoperability Framework (EIF) na několika úrovních, přičemž otevřených dat se týká zejména právní, sémantická, syntaktická a technická interoperabilita.

Právní interoperabilita – je zaměřena na překonání rozdílností mezi právními předpisy v jednotlivých členských státech, zajištění, aby při výměně informací přes hranice byla zachována právní platnost těchto informací a aby byly dodrženy právní předpisy o ochraně údajů v poskytující i přijímající zemi.

Sémantická interoperabilita - umožňuje organizacím zpracovávat smysluplným způsobem informace z vnějších zdrojů. Zajišťuje, že při výměně informací mezi stranami bude správně chápán a zachován smysl vyměňovaných informací, datových prvků a vztahů mezi nimi. Zahrnuje vytvoření slovníku pojmů pro popis vyměňovaných údajů.

Syntaktická interoperabilita - týká se popisu přesného formátu vyměňovaných informací (dat), pokud jde o gramatiku, formát a schémata.

Technická interoperabilita - souvisí s technickými stránkami zajištění propojení informačních systémů a sdílených informací. Zahrnuje specifikace rozhraní, spojové služby, služby integrace dat, prezentace a výměny údajů.

Shrnutí

Závěrem citát Alberta Einsteina:

„Všechno by mělo být tak jednoduché, jak to může být, ale ne jednodušší“

stručná rekapitulace problematiky otevřených dat

  1. Otevřená data jsou definována:
  • Mezinárodní chartou otevřených dat;
  • zákonem č.106/1999 Sb., o svobodném přístupu k informacím;
  • směrnicí Evropského parlamentu a rady 2019/1024/EU ze dne 20. června 2019 o otevřených datech a opakovaném použití informací veřejného sektoru.
  1. Definice ale nestačí, otevřená data především musí:
  • respektovat zásady Mezinárodní charty otevřených dat;
  • naplňovat definici v zákoně č. 106/1999 Sb. a být registrována v Národním katalogu otevřených dat;
  • být publikována takovým způsobem, aby bylo možné jejich další využití a zhodnocování (publikace kontextu a metadat, uznávání standardů, dodržování otevřených formálních norem);
  • dodržovat požadavky na kvalitu dat;
  • mít ošetřeny podmínky užití;
  • naplňovat požadavky kladené na jejich interoperabilitu nejen v rámci ČR, ale i v rámci EU,

aby vše nebylo jednodušší, než to může být.

  1. Otevřená data jsou významná, neboť jsou prostředkem k:
  • posilování transparentnosti VS a směrování k otevřenému vládnutí a otevřené společnosti;
  • budování e-govenmentu VS ČR (součást architektury VS - Veřejný datový fond);
  • vytvoření jednotného digitálního trhu pro podporu a rozvoj hospodářského prostředí EU;
  • vybudování sdíleného datového prostoru pro podporu inovací, vývoje a výzkumu v celé EU.

 

Drahomír Chocholatý


Tento článek vznikl v rámci projektu „Rozvoj datových politik v oblasti zlepšování kvality a interoperability dat veřejné správy “OPZ č. CZ.03.4.74/0.0/0.0/15_025/001398, který zastřešuje odbor hlavního architekta e-governmentu, Ministerstvo vnitra ČR.

EG - 1/2020 

inPage - webové stránky s AI, doménawebhosting