https://frosthead.com

Szukasz nowych odkryć w starych danych

Co dzieje się ze starymi zeszytami laboratoryjnymi i innymi zapisami danych naukowych? Nadal jest przydatny, choć nie tak bardzo, gdy odkłada się w pudełku na dole szafy. Ale teraz grupa naukowców, którzy niedawno spotkali się na konferencji Komitetu ds. Danych Nauki i Technologii (CODATA), podejmuje globalny wysiłek w celu odzyskania tych danych, podała Nature w zeszłym tygodniu. Grupa zapyta badaczy, muzea i uniwersytety o to, co mogli ukryć, i opublikuje spis tego, co znaleźli w 2012 roku. Raporty Nature :

Zagrożone są nie tylko dane ze starych książek lub zdjęć. Zagrożona jest również informacja cyfrowa zgromadzona w latach 1950–1980, ponieważ jest przechowywana na nieaktualnych nośnikach, które często ulegają pogorszeniu, takich jak taśma magnetyczna i dyskietki, co sprawia, że ​​dostęp do nich jest trudniejszy. Kraje rozwijające się przechowują niektóre z najcenniejszych danych - od użytkowania gruntów po statystyki dotyczące chorób - i najbardziej zagrożone, na przykład przez konflikty lokalne i nieodpowiednie lub niejednolite przechowywanie.

Stare rekordy do tej pory udowodniły swoją wartość. Na przykład dane z dzienników okrętowych zostały wykorzystane do zbadania historii wielorybnictwa, zmian klimatu i pola magnetycznego planety. Zooniverse --- która w przeszłości wykorzystywała moc znudzonych ludzi komputerami do przeszukiwania zdjęć nieba w poszukiwaniu supernowych i kosmicznych połączeń --- uwolniła swoją hordę obywateli-naukowców na płytach z okrętów Royal Navy z I wojny światowej zbierać dane i ulepszać bazę ekstremalnych warunków pogodowych.

Poświęć trochę czasu na tej stronie Zooniverse, a szybko zdasz sobie sprawę, jak wielkim projektem będzie pobieranie danych z dowolnych źródeł wykopanych przez grupę CODATA. Ponieważ nie wystarczy po prostu wiedzieć, co tam jest - aby dane mogły być wykorzystane i zachowane na przyszłość, trzeba je również zdigitalizować. A zarządzanie wszystkimi tymi danymi będzie kolejnym problemem. Ale zbyt dużo danych to problem, który moim zdaniem większość naukowców nie miałaby nic przeciwko.

Szukasz nowych odkryć w starych danych