Uniwersytet Oksfordzki zapytał w 2012 roku związanych z nim naukowców, jakie dane generują w swoich badaniach, czy je udostępniają i, jeśli tak, to na jakiej zasadzie. Czy dyskusja o data management wejdzie do Polski?

 


il. Daniel Mietchen, Wikimedia Commons, CC BY 4.0

 

Około 300 badaczy nauk humanistycznych, matematycznych, fizycznych i przyrodniczych, medycznych oraz społecznych wzięło udział w badaniu, którego celem było zidentyfikowanie kategorii danych, z którymi pracują lub które tworzą, oraz znalezienie sposobów na ich porządkowanie.

 

Choć udostępnianie danych badawczych w Wielkiej Brytanii jest bardziej rozpowszechnione niż w Polsce, to aż 60% zapytanych oksfordzkich naukowców nie korzystało nigdy z repozytorium danych badawczych. Zrobił to jednak co czwarty badacz, co prawdopodobnie byłoby świetnym wynikiem w Polsce.

 

Na pytanie, dlaczego nie udostępniają danych, spora część badaczy odpowiedziała, że nie są świadomi istnienia miejsc, w których mogliby to zrobić, że to ich pierwszy projekt, w którym generowane są dane, lub że nie chcą dzielić się nimi publicznie.

 

3332644561_c9d5041d02_z

zdj. Michael Mandiberg, Flickr, CC BY-SA

 

Co ważne, w badaniu brali udział przedstawiciele wielu nauk, a zatem osoby pracujące z różnymi rodzajami danych. W dyskusji wokół otwartych danych badawczych podczas konferencji „Open Access to Research Data as a Driver for Open Science” wielokrotnie akcentowano trudność ze zdefiniowaniem słowa „dane (badawcze)”. Różnią się one w zależności od dziedziny nauki, zatem odmienne są również wyzwania związane z ich udostępnianiem, np. ich format (czy dane są na tyle ujednolicone, by móc ponownie je wykorzystać) czy ilość miejsca, które zajmują na serwerach. Czy na pewno warto przechowywać wszystkie generowane dane? W jaki sposób je selekcjonować?

 

W badaniu zidentyfikowano takie dane jak: tekstowe, numeryczne, statystyczne, identyfikujące miejsce w przestrzeni, obrazy, dźwięki, multimedialne oraz bibliograficzne. Naukowcy podkreślali wagę porządkowania generowanych i zbieranych danych, jako nieodłączną część badania. Nie oznacza to jednak, że konieczne jest udostępnianie ich szerszemu gronu odbiorców. Te informacje są dla Uniwersytetu Oksfordzkiego ważne, bo mogą świadczyć o tym, że istnieje zapotrzebowanie na szkolenia z tematyki tzw. „data management”.

 

Istotny dla problemu udostępniania danych jest też styl pracy badaczy. Zdecydowana większość humanistów pracuje indywidualnie, za to badacze nauk przyrodniczych – głównie zespołowo. W toku samego badania zarządzanie danymi i ich udostępnianie może mieć zatem różny cel. Samodzielna praca nie musi wymagać dzielenia się danymi i przez to może wpływać na chęć ich udostępniania po zakończeniu badania. Istotne może być również istnienie tradycji korzystania z udostępnionych danych w danej dziedzinie nauki. To jednak głównie badawcze intuicje, których bezpośrednie potwierdzenie trudno znaleźć w wynikach.

 

Uniwersyt Oksfordzki w 2012 roku przyjął dokument „Policy on the Management of Research Data and Records”, w którym zobowiązuje się między innymi do zapewnienia naukowcom zarówno serwerów, na których mogą umieszczać dane (w badaniach uczelnianych i finansowanych z innych źródeł), jak i szkoleń z zarządzania danymi w procesie realizacji badania. Czy któraś z polskich uczelni udostępnia wszystkim swoim jednostkom taką usługę? Warto zauważyć, że taka oferta  ochroni zasoby wypracowane w ramach danej uczelni. Ich udostępnianie może przyczynić się do zwiększenia prestiżu instytucji i, pośrednio, środków na jej działalność.

 

 

Jakie wnioski z tego badania mogą być istotne dla polskiej nauki? Naukowcy z Oksfordu w znaczącej części nie byli świadomi wymagań instytucji finansujących ich badania (nie tylko samego uniwersytetu). Umowy na realizację badań to, obok dokumentów uniwersyteckich o polityce otwartości danych (jeżeli takie zostały ogłoszone), podstawowe źródło informacji o obowiązku (lub zakazie) udostępniania danych badawczych. Brak takich zapisów może być podstawą do samodzielnej decyzji badacza (w zależności od tego, kto według umowy jest posiadaczem danych) o udostępnieniu owoców swojej pracy. Powstaje coraz więcej repozytoriów (nie tylko uczelnianych i niekoniecznie polskich), które zajmują się odpowiednią ochroną danych, zapewniając im miejsce oraz otwierając do nich dostęp.

 

 

O niektórych z tych repozytoriów z pewnością będziemy jeszcze pisać. Co prawda brak w Polsce dyskusji o zarządzaniu danymi i ich udostępnianiu, lecz nie oznacza to, że polscy naukowcy nie mogą dzielić się z innymi tym, co wypracowali. Pozostaje pytanie – czy chcą?

 

Wszystkie pliki dotyczące badania są dostępne tutaj: http://damaro.oucs.ox.ac.uk/outputs.xml

Prezentację wygłoszoną podczas konferencji RECODE można zobaczyć TUTAJ (PDF), a posłuchać TUTAJ (video).

 

Wyniki badań prezentował Dr James A. J. Wilson z Uniwersytetu Oksfordzkiego podczas konferencji „Open Access to Research Data as a Driver for Open Science” w Atenach (15-16.01.2015), w której Biblioteka Otwartej Nauki miała przyjemność uczestniczyć.

 

Konferencja była podsumowaniem projektu RECODE  i wypracowanych w jego trakcie rekomendacji dla grantodawców, instytucji badawczych, menadżerów danych oraz wydawców związanych z otwartością danych badawczych.