OpenAIRE – plán managementu dat
Plán managementu dat (data management plan, DMP) představuje administrativní nástroj pro řešitele projektů, který pomáhá řídit správu dat generovaných či sbíraných v rámci projektu. Kromě jiného také stanovuje, jak budou data archivována a případně zpřístupňována během i po skončení projektu. V článku bude představen DMP z pohledu projektu OpenAIRE, jehož cílem je podpora politiky otevřeného přístupu Evropské komise (politika OA EK). Konkrétně se projekt OpenAIRE zabývá vytvářením technické, organizační, informační a propagační platformy pro politiku OA EK. Ústřední knihovna VŠB-TUO je v projektu OpenAIRE zapojena do budování sítě národních kontaktů (National Open Access Desks, NOADs). NOADs se podílejí na propagaci projektu a jeho výstupů a vytvářejí informační podporu pro řešitele projektů v rámci členských států EU.
Politika otevřeného přístup Evropské komise
Úvodem bude užitečné připomenout vývoj politiky OA EK, který započal pilotním programem otevřeného přístupu v 7. rámcovém programu. Pilotní program nastavil základní princip dosažení otevřeného přístupu k publikovaným výsledkům v sedmi vybraných vědních oblastech. Příjemci podpory z těchto oblastí byli povinni zajistit otevřený přístup k vydaným článkům zlatou nebo zelenou cestou otevřeného přístupu, tj. publikováním v otevřeném časopise nebo uložením rukopisu nebo vydavatelské verze článku do otevřeného repozitáře. Pro články vydané v otevřených časopisech platila povinnost současně uložit plný text do repozitáře. Připouštěla se možnost zajistit OA vydáním článku v hybridním časopise.
V následujícím programu Horizont 2020 byl pilotní projekt OA adaptován na povinný pro všechny podporované projekty se stejnými podmínkami pro zajištění OA, jak byly popsány výše.
V Horizontu 2020 se spustil také pilotní program na otevřené zpřístupňování výzkumných dat (Open Research Data Pilot). Opět z vybraných oblastí jsou řešitelé projektu povinni zajistit zpřístupnění výzkumných dat, na která odkazují ve vydaných publikacích.
Podle nedávno vydané tiskové zprávy se pilotní program otevřených dat změní od roku 2017 na povinný pro všechny podporované projekty. Ve zprávě se zmiňuje také plán na vytvoření cloudových služeb pro otevřenou vědu v Evropě (European Open Science Cloud). Cílem je vytvořit cloudové úložiště pro ukládání, sdílení a opětovné využití dat, zastřešující všechny vědní disciplíny.
Aktivity projektu OpenAIRE
Projekt OpenAIRE běží od roku 2010, dnes již ve své třetí etapě OpenAIRE2020. Projekt je nedílnou součástí systémové infrastruktury evropského výzkumu a řešitelům pomáhá prakticky splnit povinnosti dané politikou OA EK. OpenAIRE mimo jiné poskytuje také monitorování stavu naplňování této politiky. K významným aktivitám OpenAIRE patří budování portálu OpenAIRE a obecného datového úložiště Zenodo, provozování dotačního fondu na financování vydání publikací z ukončených projektů 7.RP a v neposlední řadě informační podpora, která má například podobu blogu nebo pravidelného newsletteru.
Pilotní program otevřených výzkumných dat
Pilotní program otevřených výzkumných dat v Horizontu 2020 (Pilot) ukládá řešitelům projektů z vybraných vědních oblastí za povinnost otevřeně zpřístupnit výzkumná data, která vzniknou během řešení projektu. Je tím myšleno, že otevřeně přístupná mají být zejména data, která jsou nezbytná k ověření výsledků uveřejněných ve vědeckých publikacích. Evropská komise záměr Pilotu sumarizuje do hesla: „as open as possible, as closed as necessary“. V odůvodněných případech je možné se z otevření dat vyvázat. Výjimky mají být použity podle zmíněného hesla jen tam, kde je to nezbytné. Otevřeného zpřístupňování dat se netýká citlivých údajů, dat určených ke komerčnímu využití, dat utajované povahy nebo v případě, že data nejsou projektem vůbec vytvořena, a nebo zveřejnění dat by bránilo splnění cílů projektu. V každém případě je v plánu managementu dat nutné tyto skutečnosti vysvětlit.
Plán managementu dat
Plán managementu dat pomáhá s řízením dat, která vznikají během řešení projektu. Účelem DMP je zajistit, aby byla vytvořena strategie, jak s daty nakládat ještě před vznikem samotných dat. Řešitelé projektu by měli formulovat záměr, jaká data budou z projektu vznikat, kam budou ukládána, komu a jak budou zpřístupněna.
Odpovědnost za DMP nese koordinátor projektu, který musí DMP vytvořit během prvních šesti měsíců trvání projektu. DMP by měl odrážet skutečný stav a měl by zachycovat změny vzniklé v průběhu projektu. Jedná se tedy o živý dokument, který je potřeba v pravidelných intervalech aktualizovat, revidovat podle skutečnosti a kontrolovat z pohledu cílů, které si na začátku stanovil. Koordinátor projektu zasílá DMP Evropské komisi spolu s ostatními průběžnými reporty.
Obsahově se DMP dotýká celého životního cyklu výzkumných dat, který zahrnuje kroky vytvoření, zpracování, analyzování, uchovávání, zpřístupňování dat. Řešitel projektu se musí rozhodnout, jaký typ dat bude sbírat (vytvářet, generovat) a v jakém formátu. Spolu s výzkumnými daty musí být zpřístupněna související dokumentace, musí být popsána a přístupná zvolená metodologie a také příslušný software a nástroje, které vedou k pochopení dat a k možnosti zpřístupněná data opětovně využít. V DMP lze zdůvodnit případ, kdy data, resp. průběžné verze dat, nebudou archivována v případě, že jejich nové generování je efektivnější, než jejich archivování.
Důležitá je také otázka správného metadatového popisu dat, který ovlivňuje jednak způsob ukládání dat, jednak jejich vyhledatelnost a také souvisí s otázkou dlouhodobé archivace dat.
Datové úložiště a metadatový standard
Tvůrce DMP by měl specifikovat, do jakého datového archivu budou data ukládána. OpenAIRE doporučuje postupovat u výběru dle následujících možností:
- Použít vhodný oborový datový repozitář
- Použít institucionální datový repozitář, pokud jej instituce řešitele projektu provozuje
- Použít obecný datový repozitář typu Zenodo
Při hledání vhodného datového archivu je možné využít registr Re3data. Při volbě správného datového úložiště je důležité zvážit také jeho důvěryhodnost z hlediska dlouhodobé archivace. Pro datové repozitáře funguje certifikace DataSeal of Approval.
Datové repozitáře zpravidla používají metadatové standardy pro popis ukládaných dat dle zvyklostí daného oboru a většinou poskytují informační podporu v této oblasti, kterou se řešitelé projektů a tvůrci DMP mohou řídit. Digital Curation Centre spravuje seznam existujících metadatových standardů. Pokud neexistuje speciální standard pro vybraný obor, lze zvolit metadatové schéma Dublin Core nebo DataCite.
Licenční podmínky zpřístupňování výzkumných dat
Obvykle provozovatelé datových archivů stanovují, jak jsou data v repozitáři spravována a jakou politikou zpřístupňování se datový archiv řídí. V DMP by mělo být určeno, jaká data a jakým způsobem budou zpřístupňována, resp. s tím úzce souvisí, jakým způsobem budou data licenčně ošetřena. Evropská komise preferuje licencování dat pomocí veřejných licencí Creative Commons (CC-BY, CC-Zero). Opět se lze inspirovat a poučit o existujících licenčních modelech v seznamu licencí. K autorskoprávním otázkám, k licencování databází či otázce osobních citlivých dat byl vytvořen konsorciem EUDAT online průvodce.
Jak reálně probíhá licencování archivovaných datových setů lze vidět na příkladu datového archivu LINDAT/CLARIN, který poskytuje informativní seznam dostupných typů licencí.
DMPonline
Výše zmíněné centrum Digital Curation Centre (Velká Británie) provozuje pro tvůrce plánu managementu dat podpůrný online formulář DMPonline, který pomáhá s tvorbou DMP, s udržováním jeho aktuálnosti a s úpravou do takové formy, jakou vyžadují poskytovatelé dotací po řešitelích projektů. Do formuláře byla přidána nápověda pro potřeby řešitelů projektů H2020. Vkládací formuláře DMPonline je sestaven tak, aby umožňoval řešitelům projektů založit prvotní plán managementu dat, jak vyžadují podmínky H2020 a dále jej ve dvou následných verzích upravovat podle reálné situace. Vyplněný formulář lze sdílet s ostatními a výstup (jednotlivé verze DMP) exportovat do požadovaného formátu (PDF, Word, Excel atd.) a exportovaný soubor použít k reportování Evropské komisi.
Závěrem
Projekt OpenAIRE pomáhá řešitelům projektů, správcům repozitářů i jednotlivým vědcům v orientaci v oblasti otevřeného přístupu, s otázkami správy otevřených repozitářů (pro publikace i výzkumná data) a jejich interoperability, v neposlední řadě také v otázkách autorsko-právních. Propaguje politiku otevřeného přístupu a souvisejících agend Evropské komise. Přes kontaktní body NOADs tvoří síť odborníků, kteří se ve svých zemích věnují propagaci politiky otevřeného přístupu a tvorbě informační podpory dle svých možností a dle úrovně, jaké se v dané zemi podařilo dosáhnout v oblasti budování otevřené vědy.
OpenAIRE vytváří ke všem řešeným agendám informační a propagační materiály, jejichž překlady jsou ukládány do kolekce v repozitáři DSpace VŠB-TUO. Konkrétně k tématu managementu dat a tvorbě plánu managementu dat byl přeložen manuál OpenAIRE Management výzkumných dat, v němž lze najít shrnutí základních informací k tvorbě DMP a užitečné odkazy pro ty, kteří se tématem chtějí zabývat hlouběji.