Small data: najlepsze praktyki udostępniania

W erze big data, gdy główny nurt dyskusji koncentruje się na korzyściach z analizy dużych zbiorów danych, łatwo pominąć znaczenie małych danych (small data). Tymczasem przecież zdecydowana większość naukowców na świecie pracuje w zespołach wytwarzających małe dane. To, według jakich standardów te dane są archiwizowane, przechowywane i udostępniane, wpływa na efektywność prowadzenia kolejnych badań i właściwe rozdysponowanie na nie środków.

W najnowszym numerze “Forum Akademickiego” (FA 07-08/2016) Marta Hoffman-Sommer porusza kilka istotnych wątków związanych z tą tematyką. Podstawowym problemem w wielu instytucjach (choć należy pamiętać o dużym zróżnicowaniu występującym w tym względzie między różnymi dyscyplinami nauki) jest brak jakiejkolwiek długoterminowej polityki przechowywania danych wytworzonych w trakcie prac badawczych prowadzonych przez ich pracowników. Odpowiedzialność za przechowanie i udostępnienie danych często scedowana zostaje de facto na samych naukowców. Po co zatem to robić? Dwa argumenty wybijają się na pierwszy plan: unikanie niepotrzebnego duplikowania wykonanej już pracy oraz weryfikacja wniosków z badań.

 

 

Kolejnym wątkiem poruszonym w artykule jest optymalny sposób udostępniania. Jeśli w danej dziedzinie funkcjonuje specjalistyczne repozytorium danych (np. GenBank), to jest to najlepszy wybór. Jeśli nie ma takiego specjalistycznego repozytorium, to naukowcy mogą skorzystać z repozytoriów ogólnych (np. RepOD).

Temat udostępniania danych badawczych nabiera coraz większego znaczenia. Rozwiązania, które zostaną przyjęte jako standardowe, zadecydują o tym, jak będzie uprawiana nauka w nadchodzących dekadach.

Dodaj komentarz


Kod antyspamowy
Odśwież

Additional information