Naraščajoč obseg in razpoložljivost spletnih virov zahtevata, da so raziskovalni podatki že od nastanka namenjeni dolgotrajnosti. Z zagotavljanjem dostopa do raziskovalnih podatkov širši raziskovalni skupnosti olajšamo dostop do znanja ter izboljšamo transparentnost raziskovanja. S tem namenom so leta 2016 izšla načela FAIR za upravljanje raziskovalnih podatkov The FAIR Guiding Principles for scientific data management and stewardship.
SangyaPundir, CC BY-SA 4.0, via Wikimedia Commons
FAIR ni standard, temveč zbir načel, na podlagi katerih so FAIR raziskovalni podatki tisti podatki, ki so najdljivi (Findable), dostopni (Accessible), interoperabilni (Interoperable) in ponovno uporabni (Reusable). Poleg tega, da podpirajo ponovno uporabo raziskovalnih podatkov posameznih znanstvenikov, načela FAIR dajejo poseben poudarek izboljšanju strojne najdljivosti in uporabe podatkov. Načela izpostavljajo dejstvo, da so v trenutnem digitalnem ekosistemu ljudje vse bolj odvisni od računalniške podpore pri spoprijemanju z naraščajočim obsegom, kompleksnostjo ter hitrostjo ustvarjanja podatkov. V teh okvirih je strojna uporabnost raziskovalnih podatkov (tj. zmožnost računalniških sistemov, da podatke najdejo, do njih dostopajo, se z njimi povežejo ter jih ponovno uporabijo brez ali z minimalno človeško intervencijo), ki jo izpostavljajo načela FAIR, ključnega pomena.
Najdljivost (Findability)
- metapodatkom je dodeljen globalno enkraten trajni identifikator (PID, npr. raziskovalni podatki so opisani z bogatimi metapodatki (vsaj datum nastanka, naslov, avtorji, ključne besede, licenca, financiranje itd.)
- metapodatki jasno in eksplicitno navajajo označevalnik raziskovalnih podatkov, ki jih opisujejo, npr. DOI
- metapodatki so registrirani ali indeksirani v iskalnem viru npr . iskalniki, bibliografske zbirke, indeksi)
Dostopnost (Accessibility)
- metapodatki so s pomočjo identifikatorja dosegljivi preko standardiziranega komunikacijskega protokola , ki je je odprt, brezplačen in univerzalen (npr. http)
- komunikacijski protokol omogoča postopke za avtentikacijo in avtorizacijo , kjer je to potrebno, o čemer mora biti uporabnik obveščen (npr. prijava z institucionalnim računom ali digitalnim certifikatom)
- metapodatki so dostopni, tudi ko sami raziskovalni podatki niso več razpoložljivi
- metapodatki so dostopni, tudi če obstajajo utemeljeni razlogi, da sami podatki niso (npr. zaradi varstva osebnih podatkov) –“as open as possible and as closed as necessary” FAIR podatki niso nujno ODPRTI podatki
Interoperabilnost (Interoperability)
- metapodatki so pripravljeni v formalnem, dostopnem, splošnem in za predstavitev znanja široko uporabnem jeziku
- metapodatki upoštevajo nadzorovano besedišče, ki sledi načelom FAIR, npr. MeSH v medicini
- metapodatki vsebujejo kvalificirane reference do drugih metapodatkov
- podatki so združljivi z drugimi podatkovnimi nizi in aplikacijami ali delovnimi procesi za analizo, hrambo in obdelavo (težimo k uporabi nelastniških, odprtih podatkovnih formatov)
Ponovna uporaba (Reusability)
- metapodatki so bogato opisani in navajajo množico natančnih in relevantnih lastnosti,
- metapodatki so opremljeni z jasno in dostopno licenco o uporabi raziskovalnih podatkov, npr. Creative Commons,
- metapodatki navajajo podrobnosti o izvoru raziskovalnih podatkov,
- v dodatni dokumentaciji opišemo vse, kar je potrebno za razumevanje in ponovno uporabo (metodologija, spremenljivke, postopki, definicije, merske enote, programska koda, format …),
- metapodatki dosegajo standarde posameznega znanstvenega področja.