Polsko-angielski słownik terminów z zakresu zarządzania danymi badawczymi
A
anonimizacja – anonymisation
Proces usuwania z danych informacji pozwalających na ustalenie tożsamości poszczególnych osób, a także odniesień do innych danych, które umożliwiają ustalenie ich tożsamości (por. Cornell University, Glossary of data management terms, data dostępu: 17.07.2023).
autorskie prawa osobiste – author’s moral rights [1]
Prawa chroniące więzi osobiste twórcy z utworem. Obejmują m.in. prawo do oznaczenia utworu swoim nazwiskiem, prawo do nienaruszalności treści i formy utworu oraz jego rzetelnego wykorzystania, a także prawo do nadzoru nad sposobem korzystania z utworu. Autorskie prawa osobiste są nieograniczone w czasie, nie można się ich zrzec ani przenieść ich na inne osoby.
autorskie prawa majątkowe – copyright (economic rights) [1]
Wyłączne prawo do korzystania z utworu i rozpowszechniania go oraz do wynagrodzenia za korzystanie z niego. Uprawniony może upoważnić inne osoby do korzystania z utworu w określonym zakresie przez udzielenie im licencji. Może także przenieść autorskie prawa majątkowe na inne osoby, odpłatnie albo za darmo. Autorskie prawa majątkowe co do zasady wygasają po 70 latach od końca roku kalendarzowego, w którym zmarł twórca.
B
baza danych – database
Dane zorganizowane zgodnie z określonym modelem charakteryzującym te dane oraz zachodzące pomiędzy nimi relacje. Zorganizowanie danych w bazę znacznie ułatwia dostęp do nich, ich aktualizację oraz zarządzanie nimi.
Born Digital – (materiały) natywnie cyfrowe
Termin odnoszący się do różnego typu materiałów, w tym danych badawczych, które zostały wytworzone wyłącznie w postaci elektronicznej; powstał w celu odróżnienia ich od materiałów, które w pierwotnej formie nie miały charakteru cyfrowego i zostały zdigitalizowane (stanowią elektroniczne odwzorowanie dokumentów w postaci pierwotnej).
C
cyfryzacja – digitization [3]
Proces tworzenia plików cyfrowych poprzez skanowanie lub inny sposób konwersji materiałów analogowych.
D
dane badawcze – research data [1]
Różnorodne materiały gromadzone w ramach prowadzenia badań naukowych (m.in. dane liczbowe, dokumenty tekstowe, notatki, kwestionariusze, wyniki ankiet, nagrania audio i wideo, fotografie, zawartość baz danych, oprogramowanie, wyniki symulacji komputerowych, protokoły metodologiczne, obserwacje laboratoryjne), definiowane między innymi na poniższe sposoby: 1) zarejestrowane materiały o charakterze faktograficznym, powszechnie uznawane przez społeczność naukową za niezbędne do oceny wyników badań naukowych; 2) dane zebrane, zaobserwowane lub wytworzone jako materiał do analizy, w celu uzyskania oryginalnych wyników naukowych; 3) wszystko, co zostało wyprodukowane lub wytworzone w ramach prowadzonych badań.
dane dynamiczne – dynamic data
W Ustawie o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego zdefiniowane jako „informacje sektora publicznego utrwalone w postaci elektronicznej podlegające częstym aktualizacjom lub aktualizacjom w czasie rzeczywistym, w tym ze względu na ich zmienność lub szybką dezaktualizację, w szczególności dane wygenerowane przez czujniki” (Zob. Dz. U. 2021 poz. 1641, Ustawa z dnia 11 sierpnia 2021 r. o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego, data dostępu: 17.07.2023).
dane osobowe – personal data [1]
Informacje dotyczące żyjącego człowieka, które pozwalają go zidentyfikować (np. imię i nazwisko, PESEL, cechy wyglądu, stan zdrowia). Wykorzystywanie danych osobowych (np. na potrzeby badań naukowych) jest regulowane przez prawo Unii Europejskiej (rozporządzenie o ochronie danych osobowych – tzw. RODO) i dozwolone wyłącznie na przewidzianych tam zasadach. W szczególności zbieranie i analizowanie danych osobowych na potrzeby badań naukowych oraz ich udostępnianie może wymagać zgody osób badanych oraz udzielenia im informacji o określonej formie i treści.
dane wrażliwe – sensitive data
Szczególna kategoria danych osobowych, podlegających zgodnie z RODO dodatkowym wymogom związanym z ich ochroną. Są to dane ujawniające pochodzenie rasowe lub etniczne, poglądy polityczne, przekonania religijne lub światopoglądowe, przynależność do związków zawodowych, dane genetyczne, dane biometryczne, dane dotyczące zdrowia, seksualności lub orientacji seksualnej.
Data Availability Statement
Opis sposobu udostępnienia danych badawczych powiązanych z opublikowanym artykułem; stanowi element publikacji, który czasami jest wymagany przez czasopisma naukowe; może wskazywać konkretne repozytoria lub serwisy, w których przechowywanie są dane, precyzować warunki dostępu do nich lub wskazywać ewentualne ograniczenia w dostępie.
data journal
Czasopismo naukowe publikujące artykuły opisujące zbiory danych badawczych. Celem data journals jest zwiększenie widoczności oraz ponownego wykorzystania danych opisywanych w artykułach.
data stewardship
Odpowiedzialne planowanie i wykonywanie wszystkich działań dotyczących danych cyfrowych przed, w trakcie oraz po zakończeniu projektu badawczego, mające na celu optymalizację użyteczności, ponownego wykorzystania i reprodukowalności powstałych danych (zob. Dutch Techcentre for Life Sciences, Research Data Management, data dostępu: 17.07.2023).
dobra osobiste – personal rights [1]
Niektóre cechy człowieka oraz przejawy jego aktywności (np. nazwisko, dobre imię, tajemnica korespondencji, godność osobista, twórczość naukowa i artystyczna), podlegające ochronie na podstawie prawa cywilnego. Ochrona ta wymaga aktywności samego zainteresowanego, który może wnieść pozew przeciwko osobie naruszającej jego dobra osobiste i zażądać np. przeprosin albo zadośćuczynienia.
DOI – Digital Object Identifier [2]
Jeden z trwałych identyfikatorów obiektów cyfrowych, pozwalający na ich odnalezienie w internecie niezależnie od wiodącego do nich adresu URL. Posiadający DOI zbiór danych można za jego pomocą zidentyfikować nawet wtedy, gdy zostanie on przeniesiony na inny serwer czy do innego repozytorium.
dokumentacja danych – data documentation
Ogół informacji niezbędnych do zrozumienia i poprawnej interpretacji danych. Informacje te mogą być zawarte w metadanych zbioru danych, słownikach, opisach metod oraz instrumentów badawczych wykorzystanych do zebrania i przetworzenia danych, a niekiedy również w samych plikach z danymi.
dozwolony użytek – copyright exceptions and limitations / fair use / fair dealing [1]
Korzystanie i rozpowszechnianie utworu chronionego prawem autorskim, które nie wymagają zgody tego, komu przysługują prawa do tego utworu. Jest ograniczone do wskazanych w ustawie o prawie autorskim celów i sposobów wykorzystywania informacji (np. na użytek osobisty albo naukowy).
E
European Open Science Cloud, EOSC (Europejska Chmura Otwartej Nauki)
Europejska inicjatywa, której celem jest stworzenie wirtualnego środowiska służącego m.in. do przechowywania, udostępniania i przetwarzania danych badawczych. W ramach EOSC tworzone są połączenia między istniejącymi i rozwijanymi infrastrukturami, usługami, narzędziami i zasobami naukowymi z różnych dziedzin, które wspólnie tworzyć będą sieć danych i usług opartych na zasadach FAIR (“web of FAIR data and services”). Obecnie zasoby EOSC przeszukiwać można w serwisie EOSC Marketplace [data dostępu: 17.07.2023], a więcej informacji na temat EOSC znaleźć można na stronie EOSC Portal [data dostępu: 17.07.2023].
embargo [2]
Okres, przez który dane badawcze nie są udostępnione publicznie. Jest on zwykle wykorzystywany po to, aby uzyskać związane z danymi patenty i/lub inne prawa własności intelektualnej oraz przygotować oparte na nich publikacje naukowe. Po jego upływie opublikowanie danych badawczych staje się możliwe.
F
FAIR [2]
Akronim słów „findable” (możliwy do znalezienia), „accessible” (dostępny), „interoperable” (interoperacyjny) i „reusable” (możliwy do ponownego wykorzystania), określający wymogi, jakie powinny spełniać udostępnione dane badawcze.
format dostępny maszynowo – machine-readable format
Format danych lub metadanych umożliwiający ich maszynową dostępność.
I
integralność danych – data integrity
Właściwość danych, która gwarantuje ich kompletność, spójność, dokładność i wiarygodność. W praktyce zapewnienie integralności danych wymaga wdrożenia odpowiednich procedur na etapie zbierania, przetwarzania i przechowywania danych, które zapobiegną błędnym i nieuprawnionym zmianom, uszkodzeniu lub usunięciu danych. Wdrożenie odpowiednich procedur w tym zakresie jest szczególnie istotne w kontekście zarządzania danymi w formie cyfrowej ze względu na łatwość dokonywania modyfikacji plików.
interoperacyjność – interoperability
Zdolność urządzeń, systemów, aplikacji oraz treści do współdziałania z innymi urządzeniami, systemami, aplikacjami oraz treściami.
J
jakość danych – data quality [3]
Jakość danych można rozpatrywać m.in. w aspekcie ich trafności, kompletności, aktualności, znaczenia, spójności źródeł, wiarygodności, odpowiedniości sposobu prezentacji oraz dostępności.
K
komercjalizacja wyników badań – commercialization of research results [1]
Czerpanie korzyści finansowych z wyników badań naukowych. Najczęściej kojarzy się z opatentowaniem wynalazku stworzonego w oparciu o uzyskane wcześniej wyniki badań, a następnie – odpłatnym udzielaniem licencji zezwalających na korzystanie z niego. Komercjalizacja jest przedmiotem regulacji prawnych, które mogą mieć znaczenie dla otwartego udostępniania danych badawczych.
komisja ds. dostępu do danych – data access committee
Grupa osób odpowiedzialnych za weryfikację i ocenę próśb o dostęp do danych.
kontrola wersji – version control [3]
Kontrolowanie w czasie zmian w danych, kodzie komputerowym, oprogramowaniu i dokumentach, w sposób umożliwiający powrót do poprzedniej wersji, co ma kluczowe znaczenie dla możliwości śledzenia historii danych, czynionych w nich zmian czy poprawiania błędów. Kontrola wersji generuje (zmienioną) kopię danych, która zostaje oznaczona unikatowym numerem wersji.
kuratorowanie danych – data curation [3]
Ogół procesów w toku cyklu życia danych, za sprawą których dane są czyszczone, dokumentowane, standaryzowane i wzajemnie ze sobą wiązane. Może obejmować między innymi wersjonowanie danych, tworzenie nowych zestawów na podstawie kilku źródeł danych, opatrywanie danych metadanymi czy kodowanie danych surowych.
L
licencje Creative Commons – Creative Commons licenses [1]
Wzory licencji opracowane przez założoną w USA organizację pozarządową Creative Commons [data dostępu: 17.07.2023], współpracującą obecnie z partnerami w wielu państwach, również w Polsce. Osoba, której przysługują prawa własności intelektualnej do określonych treści (np. zbioru danych), może oznaczyć je symbolem jednej z licencji. W ten sposób określa zakres przysługujących użytkownikom uprawnień. Wolnymi licencjami są te licencje Creative Commons, które uprawniają zarówno do sporządzania opracowań chronionej twórczości, jak i do korzystania z niej w celach komercyjnych. Warunki te spełniają licencje CC-BY (wymagająca od użytkownika podania informacji o autorstwie oraz warunkach licencji) oraz CC-BY-SA (wymagająca ponadto stosowania takiej samej licencji w przypadku udostępniania opracowania danej twórczości), a także oświadczenie CC0 (będące na gruncie prawa polskiego bardzo szeroką licencją, nienakładającą na licencjobiorcę praktycznie żadnych zobowiązań).
M
metadane – metadata [2]
Ustrukturyzowane informacje opisujące zasoby informacji, np. zbiory danych badawczych. Metadane zawierają informacje o formie i treści zasobów, dzięki czemu pozwalają na ich wyszukiwanie i identyfikację oraz zarządzanie nimi.
możliwość odczytu maszynowego – machine readability
Dostępność treści (w szczególności danych oraz metadanych) w postaci umożliwiającej ich wykorzystanie i interpretację przez maszyny (komputery).
O
obiekt cyfrowy – digital object
Sekwencja bitów tworząca pod względem operacyjnym całość analogiczną do obiektu fizycznego. Ta sama sekwencja bitów może mieć różne interpretacje, co znaczy, że różne obiekty cyfrowe mogą być tworzone za pomocą tych samych sekwencji bitów. W związku z tym założona interpretacja powinna być znana i przekazywana innym użytkownikom w formie metadanych o kodowaniu znaków i/lub formacie pliku.
ontologia – ontology
Sformalizowany model rzeczywistości, składający się z określonego zbioru pojęć (skategoryzowanych i zhierarchizowanych nazw) oraz relacji między nimi. Całość tworzy schemat pojęciowy opisujący daną dziedzinę wiedzy oraz podstawowe zasady wnioskowania w jej ramach na temat cech i własności przedmiotów nią objętych.
oprogramowanie o otwartym kodzie źródłowym – open source software
Oprogramowanie, którego kod źródłowy jest dostępny pod względem technicznym i objęte licencją umożliwiającą jego szerokie ponowne wykorzystanie. Zgodnie z formalną definicją (zamieszczoną na stronie Open Source Initiative, data dostępu: 17.07.2023), licencja taka musi zezwalać każdemu na redystrybucję oprogramowania bez ograniczeń w ramach większej całości, zarówno w postaci kodu źródłowego, jak i wynikowego (z odpowiednimi gwarancjami dostępu do kodu źródłowego), w postaci oryginalnej i zmodyfikowanej, w dowolnym celu. Większość oprogramowania open source jest jednocześnie wolnym oprogramowaniem, którego definicja (zawarta na stronie GNU, data dostępu: 17.07.2023) wymaga zapewnienia użytkownikom wszystkich czterech wolności: uruchamiania programu w dowolnym celu, modyfikacji, rozpowszechniania kopii, publicznego udostępniania ulepszeń (które także wymagają dostępu do kodu źródłowego).
otwarte dane badawcze – open research data
Zgodnie z rekomendacjami UNESCO otwarte dane badawcze obejmują m.in. dane cyfrowe i analogowe, zarówno surowe, jak i przetworzone, oraz towarzyszące im metadane, jak również zapisy liczbowe, zapisy tekstowe, obrazy i dźwięki, protokoły, kod analizy i procedury, które mogą być wykorzystywane w sposób otwarty, ponownie wykorzystywane, zachowywane i redystrybuowane przez kogokolwiek, pod warunkiem uznania autorstwa. Otwarte dane badawcze są dostępne w aktualnym, przyjaznym dla użytkownika, czytelnym dla ludzi i maszyn oraz umożliwiającym dalsze działania (actionable) formacie, zgodnie z zasadami dobrego zarządzania i opieki nad danymi, w szczególności zasadami FAIR (Findable, Accessible, Interoperable, Reusable) oraz podlegają regularnym działaniom w zakresie ich kuratorowania i utrzymywania (por. UNESCO, Recommendation on Open Science, data dostępu: 17.07.2023).
otwarta nauka – open science
Zbiór zasad i praktyk w zakresie sposobu prowadzenia badań i udostępniania ich rezultatów, których celem jest zapewnienie jak najszerszego dostępu do wyników badań oraz możliwości ich ponownego wykorzystania. Otwarta nauka obejmuje m.in. otwarty dostęp do publikacji, otwarte dane badawcze, otwarte oprogramowanie, otwarte zasoby edukacyjne, a także inicjatywy z zakresu nauki obywatelskiej. W rekomendacjach UNESCO przyjętych w 2021 r. otwarta nauka zdefiniowana została jako koncepcja łącząca różne ruchy i praktyki mające na celu udostępnianie wiedzy naukowej w sposób otwarty i możliwy do ponownego wykorzystania dla wszystkich, zacieśnienie współpracy naukowej i dzielenie się informacjami z korzyścią dla nauki i społeczeństwa oraz otwarcie procesów tworzenia i oceny wiedzy naukowej czy komunikację z podmiotami społecznymi spoza tradycyjnie rozumianej społeczności naukowej (por. UNESCO, Recommendation on Open Science, data dostępu: 17.07.2023).
otwarty dostęp – open access [1]
Udostępnienie określonych informacji (np. danych badawczych) w Internecie, w sposób umożliwiający swobodny dostęp do nich. Otwarty dostęp zakłada brak konieczności wnoszenia jakichkolwiek opłat przez odbiorców oraz brak ograniczeń technicznych (takich jak np. obowiązek rejestracji w systemie czy konieczność instalacji specjalistycznego oprogramowania). Nie jest to równoznaczne z brakiem prawnej ochrony udostępnionych informacji. Korzystanie z nich oraz dalsze udostępnianie może być ograniczone, przede wszystkim przepisami prawa własności intelektualnej. Jednak w odniesieniu do danych badawczych otwarty dostęp oznacza, że zostały one udostępnione na wolnej licencji lub w domenie publicznej. W odniesieniu do publikacji naukowych rozróżnia się natomiast otwarty dostęp gratis i libre (gratis oznacza dostępność nieodpłatną i bez ograniczeń technicznych, a dopiero libre – dodatkowe udzielenie wolnej licencji do publikacji).
otwarty format pliku – open file format
Sposób przechowywania danych na nośniku cyfrowym określony w opublikowanej i ogólnodostępnej specyfikacji, którego wdrożenie jest możliwe bez ograniczeń technicznych i prawnych. Otwarte formaty poddane procedurze standaryzacji (normalizacji) w ramach organizacji dbającej o pluralizm, inkluzywność oraz transparentność tej procedury, a także o minimalizację ograniczeń technicznych i prawnych we wdrażaniu specyfikacji, są nazywane otwartymi standardami. Nie ma jednak jednego, powszechnie przyjętego rozumienia “otwartości” w kontekście formatów i standardów. Samo pojęcie „standardu” bywa też często używane nieściśle na określenie popularnych formatów, niekoniecznie poddanych procedurze formalnej standaryzacji.
P
patent – patent [1]
Prawo własności intelektualnej chroniące wynalazek – rozwiązanie pewnego problemu technicznego, jeżeli jest nowe, posiada poziom wynalazczy i nadaje się do przemysłowego stosowania. Uprawniony ma wyłączne prawo do korzystania z wynalazku w celach zarobkowych lub zawodowych. Patent jest przyznawany przez Urząd Patentowy.
plan zarządzania danymi badawczymi – data management plan (DMP) [2]
Dokument opisujący to, co będzie działo się z danymi w trakcie projektu badawczego i po jego zakończeniu. Ma on charakter „żywego dokumentu”, który może i powinien zmieniać się wraz ze zmianami pojawiającymi się w innych obszarach projektu badawczego.
ponowne wykorzystanie – reuse [2]
Ogólny termin odnoszący się do technicznych, prawnych i metodologicznych uwarunkowań użycia danych przez dowolne osoby i/lub instytucje, w szczególności te, które nie były zaangażowane w ich wytworzenie.
prawo autorskie – copyright law [1]
Prawo wyłączne obejmujące utwory – przejawy twórczej działalności człowieka. Ochrona prawa autorskiego powstaje bez udziału organów państwa, w wyniku stworzenia utworu ustalonego w jakiejkolwiek zewnętrznej wobec twórcy postaci. Co do zasady uprawnionym jest sam twórca, chociaż przepisy przewidują odstępstwa od tej zasady, dotyczące np. utworów stworzonych przez pracowników w ramach ich obowiązków, a także programów komputerowych.
prawo sui generis do bazy danych – sui generis database right [1]
Prawo chroniące uporządkowany zbiór danych jako całość. Nie obejmuje poszczególnych elementów tego zbioru, które mogą jednak podlegać odrębnej ochronie (jak np. zbiór nagrań wideo, chronionych prawem autorskim). Prawo do bazy danych przysługuje tylko wtedy, gdy sporządzenie, weryfikacja lub prezentacja zawartości zbioru wymagały istotnego nakładu inwestycyjnego. Uprawnionym jest ten, kto poniósł ryzyko wspomnianego nakładu (przepisy taką osobę nazywają producentem bazy). Może on zbyć prawo do bazy danych lub udzielić licencji, upoważniając tym samym do korzystania z niej w określonym zakresie.
prawo „własności intelektualnej” – intellectual property [1]
Ogół przepisów lub wynikających z nich niekiedy praw wyłącznych regulujących korzystanie z dóbr niematerialnych. Zalicza się tu zazwyczaj prawo autorskie i prawa pokrewne, prawa sui generis do baz danych oraz prawa własności przemysłowej takie jak prawa z patentu, prawa do znaków towarowych, czy prawa do wzorów przemysłowych. Pojęcie praw „własności intelektualnej” obejmuje często także zakazy i obowiązki wynikające z przepisów o tajemnicy przedsiębiorcy czy przepisów o zwalczaniu nieuczciwej konkurencji. Własność w ścisłym prawniczym rozumieniu odnosi się tylko do rzeczy materialnych, pojęcie „własności intelektualnej” natomiast nie ma ścisłej prawniczej definicji i jest raczej figurą retoryczną akcentującą przyznanie wyłączności na korzystanie z dóbr niematerialnych określonym podmiotom na wzór prawa własności.
pseudonimizacja – pseudonymisation [4]
Przetwarzanie danych osobowych w taki sposób, by bez użycia dodatkowych informacji dane nie mogły zostać powiązane z osobami, których dotyczą. Dodatkowe informacje muszą być przechowywane osobno i podlegać technicznym oraz organizacyjnym środkom ochrony, tak by zapewnić, że identyfikacja osób pozostanie niemożliwa. W odróżnieniu od anonimizacji, pseudonimizacja jest procesem odwracalnym, co znaczy, że osoby, których dotyczą dane, będzie można zidentyfikować, o ile umożliwiony zostanie dostęp do dodatkowych informacji.
R
repozytorium – repository
System informatyczny umożliwiający przechowywanie publikacji naukowych lub danych badawczych oraz ich udostępnianie przez Internet.
replikacja badań – research replication
Przeprowadzenie takich samych analiz na różnych zestawach danych (zob. poradnik The Turing Way, data dostępu: 17.07.2023).
reprodukcja badań – research reproduction
Przeprowadzenie tych samych analiz na tych samych zbiorach danych (zob. poradnik The Turing Way, data dostępu: 17.07.2023).
S
słownik kontrolowany – controlled vocabulary
Zestaw znormalizowanych terminów i wyrażeń stanowiących metadane, które używane są w celu opisu, klasyfikacji i wyszukiwania treści w określonym kontekście (np. w wybranym serwisie, katalogu czy repozytorium); charakteryzuje się spójnym i jednoznacznym stosowaniem określonych terminów i wyrażeń, wykluczającym ich różną pisownię.
standard metadanych – metadata standard
Sformalizowany i szeroko stosowany sposób opisu danych. Standard metadanych określa strukturę opisu metadanowego oraz znaczenie stosowanych w nim pojęć. Przykładami takich standardów są DataCite (ogólny standard, którego spełnienie umożliwia zdobycie identyfikatora DOI) czy DDI (standard metadanych dla danych społecznych).
storage – sposób przechowywania danych [4]
Technologia informatyczna umożliwiająca zachowanie danych w formacie cyfrowym przy użyciu komponentów komputerowych i nośników zapisywalnych, w tym usług chmurowych. Przykładami takich technologii mogą być dyski przenośne lub pendrive’y, uniwersyteckie dyski sieciowe czy usługi przechowywania danych w chmurze.
T
trwały identyfikator – persistent identifier
Unikalna w skali globalnej sekwencja znaków umożliwiająca jednoznaczne i trwałe identyfikowanie obiektu, z którym jest powiązana; może identyfikować różnego typu materiały, w tym publikacje, dane badawcze i inne materiały (np. DOI Digital Object Identifier; ISSN, International Standard Serial Number, ISSN), instytucje (ROR, Research Organization Registry), a także osoby (ORCID, Open Researcher and Contributor ID); powszechnie stosowanym trwałym identyfikatorem danych badawczych jest DOI.
tworzenie kopii zapasowych – backup [4]
Proces kopiowania danych w postaci cyfrowej i przechowywania ich na innym urządzeniu, mający na celu zachowanie bezpieczeństwa danych i zapobieżenie ich utracie. Kopia zapasowa może mieć charakter pełny (przy okazji każdego tworzenia kopii zapasowej zachowywane są wszystkie pliki) lub częściowy (każdorazowo zachowywana jest jedynie część plików, np. nowe pliki).
W
wolne licencje – free licenses [1]
Licencje, na podstawie których każdy zainteresowany uzyskuje zezwolenie na korzystanie z licencjonowanego przedmiotu w dowolnym zakresie (na wszystkich polach eksploatacji, również w celu komercyjnym, w oryginale oraz w postaci opracowania/ modyfikacji), a także na jego swobodne rozpowszechnianie i modyfikowanie. Wolne licencje są nieodpłatne i nie nakładają na licencjobiorców zobowiązań idących dalej niż obowiązki przekazywania odbiorcom określonych informacji (np. o autorze, źródle, licencji – tzw. klauzule uznania autorstwa) lub obowiązki stosowania takiej samej licencji w przypadku rozpowszechniania modyfikacji (tzw. klauzule copyleft lub sharealike).
Z
zabezpieczenie danych – data preservation
Ogół czynności i procesów mających zapewnić dostęp do cyfrowych danych badawczych w średnim i długim okresie. Odpowiednie zabezpieczenie danych powinno uwzględniać zarówno kwestie związane z ich przechowywaniem, jak i stale zachodzącymi zmianami o charakterze technologicznym - takimi jak pojawianie się nowych formatów danych i nowych form dostępu do nich - czy zachowaniem możliwości uruchomienia oprogramowania niezbędnego do ich analizy.
zarządzanie danymi badawczymi – research data management
Zbiór procedur, zasad i dobrych praktyk w zakresie gromadzenia, przechowywania, opracowywania, udostępniania i archiwizowania danych badawczych, którego celem jest zagwarantowanie bezpieczeństwa i integralności danych, a także określenie zasad ich udostępniania i ponownego wykorzystania. Narzędziem pozwalającym zaplanować właściwe zarządzanie danymi badawczymi jest plan zarządzania danymi.
zbiór danych – dataset (również: data set)
Zestaw plików zawierających dane badawcze, powstałych w toku badań w ramach realizacji projektu badawczego i/lub przygotowywania artykułu naukowego, wraz z towarzyszącymi im metadanymi. Metadane te opisują dane oraz wskazują, kto je wytworzył i kto może uzyskać do nich dostęp (zob. U.S. Department of Agriculture, Data Management Glossary, data dostępu: 17.07.2023).
Definicje oznaczone cyframi zaczerpnięte lub opracowane zostały z poniższych źródeł [data dostępu: 17.07.2023].
[1] K. Gaczyńska, N. Rycko, K. Siewicz, Prawne aspekty otwierania danych badawczych – poradnik, Warszawa 2022. Broszura dostępna na stronie Platformy Otwartej Nauki (na licencji Creative Commons – Uznanie Autorstwa 4.0).
[2] W. Fenrich, Selekcja i przygotowanie danych badawczych do udostępnienia, Warszawa 2019. Broszura dostępna na stronie Platformy Otwartej Nauki (na licencji Creative Commons – Uznanie Autorstwa 4.0).
[3] Committee on Data International Science Council, Research Data Management Terminology (na licencji Creative Commons – Uznanie Autorstwa 4.0).
[4] OpenAIRE, Research Data Management Glossary (na licencji Creative Commons – Uznanie Autorstwa 4.0).