Chcemy zachęcać, a nie zmuszać do udostępniania wyników badań - transkrypcja

A jak ocenia Pan obecne funkcjonowanie Repozytorium UW? Czy są jakieś plany, aby stało się ono repozytorium instytucjonalnym z prawdziwego zdarzenia, czy też pozostanie ono tym, czym faktycznie jest, czyli miejscem, w którym przede wszystkim deponowane są doktoraty?

To jest fragment dyskusji, czy opłaca się budować repozytoria instytucjonalne, czy też repozytoria tematyczne. W tej chwili repozytorium uniwersyteckie jest takim klasycznym repozytorium instytucjonalnym i przede wszystkim znajdują się tam prace doktorskie, które są formalnymi elementami niezbędnymi w rozwoju kariery badaczy. Wierzę w to, że coraz więcej osób będzie zainteresowanych umieszczaniem tam wyników swoich prac. Natomiast na pewno potrzebne jest także zainwestowanie w ułatwienia, które pozwalałyby na to, żeby rzeczy, które tam już są, mogły być łatwo udostępniane. Czyli obniżenie progu komplikacji, który wiąże się z korzystaniem z takiego repozytorium – przeszukiwanie go bez konieczności żmudnego ręcznego przeglądania wszystkiego, co tam jest. Myślę, że ono będzie się rozwijało, ale nie mam wrażenia, że będziemy za chwilę świadkami jakiegoś Big Bangu i nagle stanie się to narzędzie, do którego 2–3 razy w tygodniu zaglądamy, żeby zobaczyć, czy coś nowego, ciekawego się tam dla nas pojawiło, i że będzie to stały element naszej pracy naukowej.

Z tego, co Pan mówi, można wywnioskować, że zdecydowanie upatruje Pan większy sens w repozytoriach dziedzinowych. W związku z tym, czy UW rozważa stworzenie jakiejś sieci repozytoriów we współpracy z innymi instytucjami, które tak jak Uniwersytet Toruński czy Uniwersytet Poznański są dość aktywne w tym obszarze? Być może wtedy dałoby się stworzyć  jakieś konsorcjum, które umożliwiłoby zbudowanie ogólnopolskiego dziedzinowego międzyuczelnianego repozytorium?

Nie wiem, czy jest sens mówić o ogólnopolskim repozytorium dziedzinowym, dlatego że w wielu dziedzinach można sobie wyobrazić takie repozytoria europejskie albo nawet światowe. Na pewno będzie to zależało od dyscypliny naukowej. Jeżeli będziemy myśleli na przykład o archeologii obszaru Polski czy na przykład badaniach językoznawczych, to one siłą rzeczy będą miały charakter krajowy, bo tak jest zdefiniowany obszar tych badań. Ale na przykład w matematyce trudno sobie wyobrazić, żeby miało sens tworzenie polskiego repozytorium matematycznego. To mogą być repozytoria światowe, ponieważ wówczas w większym stopniu ułatwia się do nich dostęp zainteresowanym osobom z innych krajów. Badamy takie możliwości.

Ciekawa inicjatywa, poniekąd pokrewna, dotyczy humanistyki cyfrowej, gdzie zarówno badane obiekty, jak i informacja udostępniane są w formie cyfrowej. I między innymi sposób udostępniania takiej informacji jest jednym z dużych wyzwań. Tak więc w wielu miejscach coś się dzieje, chociaż nie są to działania bardzo silnie ze sobą skoordynowane. Raczej widzimy to w wielu miejscach jako inicjatywy oddolne, których rozwój warto wspierać. Moim zdaniem one mają szansę znacznie szybciej rozwinąć wolny dostęp niż działania instytucjonalne. Te też są potrzebne, ale ja bym nie ograniczał tych działań tylko do instytucjonalnych projektów o charakterze ogólnouniwersyteckim czy do sieci uniwersytetów.

Na koniec pozwolę sobie odnieść się do Pańskiej dziedziny nauki. Jest Pan chemikiem, a wiadomo, że w obszarze nauk ścisłych otwarty dostęp znajdował zawsze większe zrozumienie, lepszy grunt niż w humanistyce. Chciałem spytać o otwarte dane, o których można powiedzieć, że to kolejny rozdział otwartej nauki po otwartym dostępie. Czy uważa Pan, że otwarte dane mają przyszłość?

Bardzo dużym wyzwaniem przy otwartych danych jest – szczególnie w naukach eksperymentalnych – dobre opisanie, w jakich warunkach zostały one zebrane. W takich naukach jak na przykład chemia jest to często zagadnienie naprawdę bardzo skomplikowane. Jeżeli robimy eksperyment, z którego wynikają jakieś dane, to po pierwsze musimy bardzo dokładnie opisać wszystko, czego użyliśmy, czyli zarówno temperaturę, dokładny spis substancji, ich klasy czystości, a także informację o tym, jak był prowadzony ten eksperyment, przy pomocy jakich urządzeń i tak dalej. Często samo opisanie tego, tak żeby można było te informacje skutecznie wykorzystać, jest już samo w sobie dużym wyzwaniem.

Drugą rzeczą jest format takich danych. Bardzo wiele pomiarów jest robionych przy pomocy urządzeń, które często przechowują dane w różnych formatach wykorzystywanych przez oprogramowanie. Problem pojawia się, gdy w przypadku danych zmierzonych 10 czy 15 lat temu nie ma już programów, które mogłyby czytać te formaty. Jest to więc kwestia zapisania tych danych tak, żeby mogły być, po pierwsze, odczytywane również za wiele lat, a po drugie, żeby zawierały komplet informacji mówiących o tym, jak to zostało zmierzone i z czym można to porównać.

To są zadania nietrywialne. Pewne dane są łatwe do takiego udostępnienia – takie, które dotyczą bardzo standardowych albo zestandaryzowanych metod badawczych. Natomiast tam, gdzie mamy do czynienia z badaniami, które dopiero rozwijają się na świeżym terenie, gdzie ani nie ma standardów, ani jeszcze niedokładnie wiadomo, które parametry są bardzo istotne, a które drugorzędne, to wtedy jest trudniej. Ale jest też duże zapotrzebowanie na takie dane ze względu na to, że jedną z podstaw nauk eksperymentalnych jak fizyka czy chemia jest możliwość zrobienia eksperymentu i powtórzenia go. Uważamy, że rezultaty wiarygodne to takie, które mogą być powtórzone przez każdego. Ich opis w artykułach naukowych czy w publikacjach powinien być na tyle dokładny, żeby umożliwić odtworzenie takich eksperymentów i sprawdzenie, że dane rzeczywiście są takie same. Tu zapewne też sporo będzie się działo.

Pamiętam, że w bardzo starych artykułach umieszczano takie podstawowe dane: gdy na przykład suszono jakąś substancję, ważono tygiel z tą substancją i zapisywano wyniki co godzinę. W tabeli z informacjami podane było, ile ten tygiel ważył. Później one znikły, częściowo ze względu na automatyzację, częściowo dlatego że ciekawsze były informacje wyższego rzędu. Wygląda na to, że teraz do tego wracamy. Że oprócz bardzo ogólnego wyniku eksperymentu chcielibyśmy również mieć dostęp do konkretnych informacji, na przykład ile ważył tygiel w czwartej godzinie czy coś podobnego.

Panie Rektorze, dziękuję bardzo za tę ciekawą rozmowę.

Dziękuję.

Obejrzyj wywiad

Additional information