Udostępnianie danych musi stać się integralną częścią procesu badawczego – transkrypcja

Porozmawiajmy o zachęcaniu do otwartości. Naukowcy potrzebują, by ich motywować do otwierania swoich prac – do darmowego udostępniania artykułów i dzielenia się danymi. O jakim rodzaju przynęty powinniśmy myśleć, chcąc ich pobudzić do szerszego udostępniania danych?

Odpowiadając na to pytanie, mogę przyjąć kilka różnych ról. Jedna z nich związana jest z pracą w instytucji finansującej badania. Zatem jako grantodawcy mamy politykę, zgodnie z którą mówimy: „Chcąc skorzystać z naszych środków, musisz zrobić coś w zamian. Obecnie oczekujemy, że przekażesz kopię zebranych przez siebie danych do jednego z naszych centrów danych. Jeśli wspólnie dojdziemy do wniosku, że mają one długotrwałą wartość, to będziemy oczekiwali zgody na ich długoterminowe przechowywanie i wykorzystywanie w naszym centrum danych”. Niestety, niektórzy nasi badacze wciąż mają z tym problem. Mówią, że to dodatkowe utrudnienie. Jednak jako grantodawcy możemy powiedzieć: „Jeśli tego nie zrobisz, nie dostaniesz kolejnej dotacji”. Mówi się dziś o metodzie kija i marchewki. Ja twierdzę, że to duża marchewka, którą można przywalić.

A mówiąc poważniej: szukamy środków zachęty w obszarach związanych z cytowalnością danych. W badaniach naukowych walutą, by tak rzec, jest cytowalność artykułu i jego wykorzystywanie przez innych badaczy. I tak pomysł publikowania zbiorów danych lub informacji na temat takich zbiorów w czasopismach z danymi może prowadzić do wzrostu cytowań danego artykułu. Naukowiec badający dane zdobywa zatem uznanie za swój wysiłek włożony w ich opracowanie. Trzeba też wynagradzać naukowców, wykorzystując alternatywne metryki pozwalające mierzyć liczbę pobrań danych z określonego zbioru w repozytorium. Zadanie podobne do indeksu cytowań opracowywanego przez Thomson Reuters, które na razie znajduje się dopiero na początkowym etapie. Ale to właśnie przykład innych narzędzi, z których możemy skorzystać.

Musimy więc szukać sposobów zachęty, ale moim zdaniem są to do pewnego stopnia rozwiązania na krótką metę. Pomagają one lepiej zakorzenić w kulturze badawczej filozofię lepszego zarządzania danymi i dzielenia się nimi, jednak na dłuższą metę jedynym rozwiązaniem jest dobrowolne udostępnianie danych jako część procesu prowadzenia badań. Tak by badacze mówili: „Chwileczkę, moje badania nie są zakończone – jeszcze nie opracowałem danych, nie dołączyłem do nich dodatkowych informacji ani nie umieściłem ich we właściwym repozytorium czy centrum danych”. Na podobnej zasadzie żaden rozsądny naukowiec nie powie dziś: „Dobrze, skończyłem te badania, ale nie będę sobie zawracał głowy ich publikacją. To zabiera tyle czasu. Lepiej wezmę się od razu za kolejne”. No dobrze, może jest paru takich, ale większość badaczy uważa publikację wyników badań za integralną część procesu badawczego. W taki sam sposób coraz więcej naukowców postrzega dziś również udostępnianie danych. To jak osnowa i wątek w tkactwie. Musi być zintegrowane z materią procesu badawczego. Można to osiągnąć dopiero wtedy, gdy badacze zdadzą sobie sprawę, że to właśnie oznacza prowadzenie badań w erze cyfrowej. I nie chodzi tu tylko o udostępnianie. Ono jest w tym przypadku jedynie produktem ubocznym. W moim odczuciu chodzi o cały obszar odtwarzalności i wiarygodności badań.

Uważam, że w erze cyfrowej badanie naukowe zasadniczo różni się od badania w tradycyjnym sensie. I część naukowców zaczyna rozumieć, że trzeba udostępniać dane badawcze, aby pozwolić innym powtórzyć swoje badania lub je zweryfikować albo po prostu dowieść, że dane te są jawne i prawdziwe. Dziś nie jest wskazane mówić: „Zaufajcie mi i moim wynikom. Jestem naukowcem. Mam doktorat. Możecie mi wierzyć” czy „Dobrze, udostępnię wam swoje dane, jeśli tylko je znajdę”. Jak to świadczy o twoich możliwościach? O jakości twojej pracy badawczej? A zatem zachęta – owszem, ale w krótkiej perspektywie. W dłuższej, musi to być włączone w samą materię procesu badawczego, w sam proces, w sposób myślenia o prowadzeniu badań.

Porozmawiajmy teraz o polityce naukowej i finansowaniu. Otwarty dostęp, otwarte dane, otwarta nauka w ogóle to długoterminowe projekty i jako takie wymagają długoterminowego finansowania. Z drugiej strony Komisja Europejska przedstawia otwartą naukę jako narzędzie wspierające innowacyjność. Chciałbym zapytać, w jaki sposób można zapewnić trwałe finansowanie projektów w otwartej nauce. We współpracy z sektorem prywatnym? Co uważasz tutaj za optymalne rozwiązanie?

A co masz na myśli, mówiąc o projektach otwartej nauki? Czy w otwartej nauce jest coś szczególnego, co wymagałoby dodatkowych funduszy, innych niż te wykorzystywane w finansowaniu badań naukowych w ogóle?

Mam na myśli ogólnie rozumianą infrastrukturę otwartej nauki. Mamy różne projekty, na przykład OpenAIRE. Aby zabezpieczyć zbiory danych, aby stworzyć długoterminową politykę, trzeba nakładów finansowych.

Rozumiem. Ujmując rzecz z perspektywy instytucji finansującej badania, zaangażowanej w rozwój polityki w tym zakresie – musimy zrozumieć, że rozpowszechnianie wyników badań naukowych, czy to artykułów w otwartym dostępie, czy danych w repozytoriach lub centrach danych, jest częścią procesu badawczego. To nie jakiś nadprogramowy dodatek finansowany niezależnie od samych badań, ale sprawa zasadnicza. A zatem w dłuższej perspektywie koszty utrzymania infrastruktury badawczej niezbędnej do realizacji tych zadań obciążą grantodawców. Ci zaś muszą zaakceptować taki stan rzeczy, stanąć na wysokości zadania i sprawiedliwie partycypować w kosztach.

NERC jako instytucja finansujące badania w Wielkiej Brytanii już tak robi. Jako jedna z siedmiu brytyjskich Rad ds. badań naukowych przeznaczamy znaczne środki na finansowanie otwartego dostępu, ponieważ zdajemy sobie sprawę, że choć pieniądze te mogłyby zostać przeznaczone na nowe badania, to jednak koszty związane z otwartym dostępem stanowią część prowadzonych badań. W dłuższej perspektywie musimy wspólnie z finansowanymi przez nas instytucjami określić, skąd dokładnie wynikają te koszty.

Moim zdaniem długoterminowe rozwiązanie nie może się opierać na finansowaniu w ramach specjalnych projektów, jak np. OpenAIRE. Takie projekty, jak właśnie OpenAIRE czy Recode, zawsze były bardzo pomocne przy opracowywaniu planu działania i wytyczaniu szlaków np. w obszarze infrastruktury. Ale w dłuższej perspektywie, by powrócić na moment do odpowiedzi na poprzednie pytanie, otwartość musi stać się częścią materii badawczej, być ściśle zespolona jak osnowa i wątek w tkanym materiale. W dalszej kolejności prowadzi to do osób finansujących nadania, czyli rządów, które muszą zrozumieć, że konieczną częścią infrastruktury badawczej są narzędzia umożliwiające dzielenie się danymi, otwarty dostęp do nich i do publikacji naukowych.

Musimy też zrozumieć, że nowoczesne badania prowadzone w erze cyfrowej mogą okazać się bardziej kosztowne od tych prowadzonych w modelu bardziej tradycyjnym – może nie zamkniętym, ale mniej skłonnym do dzielenia się, gdzie wystarczyło opublikować artykuł a dane pozostawały niedostępne. Choć trzeba przyznać, że kiedyś publikowano je na końcu czasopism w postaci zbiorów tabel. Musimy zrozumieć, że najprawdopodobniej ostatecznie będziemy prowadzić nieco mniej badań, ale za to nasze projekty badawcze będą lepsze, pod warunkiem że środki finansowe pozostaną mniej więcej takie same.

Polska pracuje obecnie w tym właśnie obszarze, przygotowując prawo zobowiązujące naukowców do otwierania danych i artykułów naukowych. O czym powinniśmy szczególnie pamiętać, wprowadzając to prawo? Od czego zacząć? Wspominałeś już o tym, ale może masz jakieś wskazówki?

Nasze brytyjskie doświadczenie pokazuje, że koniec końców za słowami muszą pójść czyny. W Wielkiej Brytanii grantodawcy ustanowili obowiązującą wszystkie Rady ds. naukowych politykę otwartego dostępu, zorientowaną także na otwarte dane. Jeśli zamierza się coś takiego zrobić, trzeba dysponować wystarczającymi środkami, by to na pewno zrealizować. W przeciwnym razie jest to po prostu polityka grandilokwencji. Dużo się mówi, wstaje minister, wygłasza przemówienie, ale nic dalej się nie dzieje. Jedna rzecz to coś mówić, druga – robić. A do tego potrzebne są środki.

Jednak nie chodzi tylko o pieniądze... Oczywiście, ostatecznie wszystko sprowadza się do pieniędzy, ale tutaj potrzeba jeszcze ludzi. Ludzi, którzy mają wystarczająco dużo entuzjazmu, by spróbować wcielić to w życie. Chodzi o stworzenie grupy ekspertów, którzy mogliby doradzać innym. Pokazywać dobre przykłady działających rozwiązań. Mogą to być osoby z państw, które już opracowały takie rozwiązania, na przykład z Wielkiej Brytanii czy USA. Chodzi o przykłady, jak poradzono sobie z określonymi problemami i jak to doświadczenie mogłoby zostać wykorzystane w polskich warunkach.

Ale ostatecznie wszystko sprowadza się do środków finansowych. Jeśli chce się w tym obszarze wprowadzić politykę, która będzie działać, trzeba mieć na to fundusze. Czy to na potrzeby zbudowania infrastruktury zarządzania danymi, czy na potrzeby szkoleniowe, czy kadrowe, czy wreszcie – w przypadku otwartych czasopism – na opłaty za publikację artykułów.

Marku, dziękuję bardzo za Twój czas i ciekawą rozmowę.

Cała przyjemność po mojej stronie.

Obejrzyj wywiad

 

Additional information