/rumfart

Format til astronomiske data sikrer Vatikanets bibliotek

ESA's dataformat Fits benyttes nu til digitalisering af Vatikanets mange gamle bøger, så de bevares for eftertiden.

Klik for at se billedet i stort

Et pilot-projekt er i gang med at benytte Fits-dataformatet ved digitaliseringen af dele af Vatikanbibliotekets enorme bogsamling. (Foto: Vatican Library)


Dokumentation

Af Thomas A. E. Andersen, søndag 01. jan 2012 kl. 10:00

Vatikanet fik hjælp fra rumfart, da man skulle finde et elektronisk filformat til at opbevare de mange unikke manuskripter, hvoraf flere er over tusind år gamle.

Valget faldt på filformatet Fits, der benyttes til at opbevare en række astronomiske data.

Det var forskere fra ESA og Nasa, der i 70’erne udviklede Fits (Flexible Image Transport System) til brug inden for radioastronomien. Dataformatet benyttes i dag til opbevaring af astronomiske og astrofysiske data fra mange forskellige rummissioner.

Fits var løsningen
Lederen af ESA's videnskabelige arkiv, Pedro Osuna, oplyser i en pressemeddelelse, at enhver slags data kan gemmes i Fits-formatet. ESA benytter det til data fra Herschel-, Integral-, XMM-Newton- og Soho-rumteleskoperne.

Et af de store problemer har været at finde et format, der også kan læses om hundrede år – det er et problem, som både forskere og bibliotekarer har arbejdet med.

Fits-formatet indeholder i toppen en beskrivelse af formatet i tekstformat, så man altid kan se, hvordan filen skal læses. Pedro Osuna, påpeger, at hermed er Fits bagudkompatibelt. En Fits-fil fra i dag kan stadig læses om hundrede år, og en Fits-fil fra for 20 år siden kan også læses i dag.

Dr. Giuseppe Di Persio fra Italiens national institut for astrofysik samarbejder nu med Vatikanets bibliotek på et pilotprojekt, som skal afprøve brugen af Fits-formatet ved digitalisering af Vatikanets enorme bog- og manuskriptsamling. Målet er at sikre, at arkivet er bevaret for eftertiden og stadig i et format som kan læses om 20 til 100 år, hvor der findes nye teknologier, som vi ikke kender i dag.

Vatikanets bibliotek er grundlagt i år 1475 og indeholder titusindvis af manuskripter og skriftruller fra længe før bogtrykkekunsten blev opfundet. Enkelte af dem er over 1.800 år gamle.

Ud over at gøre de mange unikke manuskripter tilgængelige, vil digitaliseringen også være med til at bevare dem, da de mange håndteringer, når de skal læses, er med til at nedbryde dem.

Luciano Ammenti, som er leder af Vatikanets informations- og teknologicenter oplyser, at Fits blev valgt, på grund af dets tidløshed, og da det er open source og dermed ikke kæde sammen med et firma eller produkt.



01. jan 2012 kl 11:10

avatar

Benny Allan Andersen

Tid.

Vatikanets bibliotek er grundlagt i 1475 og indeholder titusindvis af manuskripter og skriftruller fra længe før bogtrykkekunsten blev opfundet. Enkelte af dem er over 1800 år gamle.

Det tager dem mindst 20 år at arkivere biblioteket under Vatikanet.
Man kan sikkert også læse mine jpg-billeder om 100 år, hvis altså man har en maskine, der kan læse dem. Ellers må man jo selv konstruere en pc, der til den tid kan læse formatet. Allerede om 10 år bruges formodentligt et andet billedformat. Microsoft har rumlet med det et par år.


01. jan 2012 kl 11:30

avatar

Poul-Henning Kamp

Re: Tid.


Man kan sikkert også læse mine jpg-billeder om 100 år,[...]

JPEG er et informationstabende komprimeret billedformat med rigtige dårlige faciliteter for at registrere metadata, derfor bruges det stort set ikke af officielle arkiver af nogen form. Så vidt jeg husker er/var der også noget patent-pølle.

JPEG2000 har vist nok gjort nogle fremskridt på disse fronter, men anvendes stadig primært til fotos af virkeligheden, fordi komprimeringsartifakterne stadig ser grimme ud i højkontrast højfrekvent materiale som scannet text.


01. jan 2012 kl 12:11

Bjarke Mønnike

Har brugt julen....

........til at redigere digitale billeder fra en 20 års periode. Fra kassette bånd(film) over floppyer , CDer, gamle harddiske, Flashcard og USB tingester.

Det har været noget af et arbejde, at få alt , specielt filmene ,til at virke på dagens PC udstyr, med den smule viden jeg om sagerne......Jeg har måtte sande at programopdateringer bestemt ikke altid er et gode ,når det billeder man skal bevare

Det korte og lange er, at papir er et fantastisk medie at opbevare ting på der skal bevares, set i lyset af hvor hurtigt datating ændrer sig, men papir kræver også megen plads at opbevare og kræver større arbejde at finder rundt i ....men alligevel.

Så mit spørgsmål, som amatør i den verden går på, hvad er der så særegent ved FITS, som gør ,at man ikke med det samme indfører det universielt så alle kunne have glæde af dette de næste 100 år?

Vi har allerede to dataformater at slås med til billeder, JPEG( i forskellige versioner) og RAW hvor man allerede nu kan se deres problemer, når der kommer opdateringer på billedredigerings programmerne. Opdateringer der gør at man er nødt til og heldigvis har gjort det, at opbevare de gamle programmer.



01. jan 2012 kl 12:24

avatar

Poul-Henning Kamp

Re: Har brugt julen....


Så mit spørgsmål, som amatør i den verden går på, hvad er der så særegent ved FITS, som gør ,at man ikke med det samme indfører det universielt så alle kunne have glæde af dette de næste 100 år?

FITS fylder meget mere end f.eks JPEG. Formatet er lavet til at bevare og tillgængeliggøre alle relevante informationer om og i et astronomisk datasæt for enhver pris, mens almindelige mennesker typisk værdsætter at ting ikke fylder mere end nødvendigt osv.

Et eksempel på en FITS fil: ftp://legacy.gsfc.nasa.gov/fit....txt


01. jan 2012 kl 12:44

Bjarke Mønnike

Re: Har brugt julen....

Tak PHK
Men det med at fylde lader da ikke til at være noget der bekymrer.....set i lyset af de størrelser harddiske nye PC er forsynet med for at køre nutidens programmer :o)


01. jan 2012 kl 14:15

Lindy Madsen

Re: Tid.


Man kan sikkert også læse mine jpg-billeder om 100 år,[...]

JPEG er et informationstabende komprimeret billedformat med rigtige dårlige faciliteter for at registrere metadata, derfor bruges det stort set ikke af officielle arkiver af nogen form. Så vidt jeg husker er/var der også noget patent-pølle.

JPEG2000 har vist nok gjort nogle fremskridt på disse fronter, men anvendes stadig primært til fotos af virkeligheden, fordi komprimeringsartifakterne stadig ser grimme ud i højkontrast højfrekvent materiale som scannet text.

Jpeg er som du siger et lossy filformat, og Jpeg2000 har faktisk en indstilling der ligesom FLAC til lyd, kan indstilles til at bevarer alle data. De fjerner med andre ord kun stilhed eller f.eks. steder hvor der er ren farve, sådan at kanter, kontraster og nuancer aldrig påvirkes. Men det er patenteret og derfor vil man sjældent se det.

Desuden blev Jpeg2000 udviklet for over 15 år siden, og det har endnu ikke overtaget. Microsofts pendant, har også været kendt i mange år, og flere andre formater har været fremme i lyset, men ingen har overtaget de klassiske, primært fordi de er patenteret på en måde, der ikke gør dem brugbare for større samlinger, biblioteker osv. Der mangler vi flere åbne formater, som Flac, Ogg til lys, og Theora til video...

Det undre mig, at FITS blev udviklet for 40 år siden, men man kan kun læse filerne fra 20 år siden?

Jeg tror nu nok, at jpg også findes om 100 år, da det er det mest anvendte format... Måske overtager png, men lad os nu se....


01. jan 2012 kl 19:33

avatar

Joachim Michaelis

Lossless

PNG er lossless, og mig bekendt en åben standard. Jeg kender dog ikke mulighederne for at gemme meta-data i det format. IFF ILBM kan indeholde lossless 24-bit grafik og supporter enhver slags metadata. Desværre er det begrænset til max 4 gigabytes.

FITS har jeg kun set nævnt blandt astronomer, og synes ikke at være syndeligt let at læse ind med almindeligt kendt software.


01. jan 2012 kl 20:03

Lindy Madsen

Nogen der kender opløsning?

Nogen der kender opløsningen/DPI på det de skanner ind? Eller blot nogle flere detaljer om metoden?


01. jan 2012 kl 21:18

Bjarke Mønnike

Jeg har måttet konstatere

At jeg på en gammeldags floppydisk kunne have 20 JPEG billeder i 1998 kan jeg i dag ikke kan have et eneste JPEG billede af idag.
Bare metadataene for et JPEG billde af idag nægter mit A drev at gemme.

Så den jammer med at et FITS billede skulle fylde en masse, er jo et overstået problem idag, hvor billeder bliver gemt iRAW på billig diskplads.
Mine unger har givet mig externe diske på 600 GB på størrelser der kan være i en cigaretpakke.


01. jan 2012 kl 21:43

Lars Tørnes Hansen

Re: Lossless


FITS har jeg kun set nævnt blandt astronomer, og synes ikke at være syndeligt let at læse ind med almindeligt kendt software.

http://www.spacetelescope.org/...age/

Gratis FITS plugin til Adobe Photoshop.

Derudover kan GIMP (Gratis Open Source pendant til Photoshop) læse og skrive FITS filer. Kilde: http://www.ftgimp.com/help/C/f...html
For dem der bruger Windows kan GIMP for Windows downloades herfra:
http://gimp-win.sourceforge.ne...html (Link fundet på http://www.gimp.org/windows/)

Mere om FITS formatet kan findes på: http://fits.gsfc.nasa.gov/


01. jan 2012 kl 22:09

Lars Tørnes Hansen

Re: Lossless


FITS har jeg kun set nævnt blandt astronomer, og synes ikke at være syndeligt let at læse ind med almindeligt kendt software.

http://www.spacetelescope.org/...age/

Gratis FITS plugin til Adobe Photoshop.

Derudover kan GIMP (Gratis Open Source pendant til Photoshop) læse og skrive FITS filer. Kilde: http://www.ftgimp.com/help/C/f...html
For dem der bruger Windows kan GIMP for Windows downloades herfra:
http://gimp-win.sourceforge.ne...html (Link fundet på http://www.gimp.org/windows/)

Mere om FITS formatet kan findes på: http://fits.gsfc.nasa.gov/

Version 3.0+ af FITS Liberator kræver ikke Adobe Photoshop, da det er et selvstændigt program


02. jan 2012 kl 07:04

Kai Birger Nielsen

Re: Lossless

Bare en lille kommentar. Vatikanet opbevarer forhåbentligt deres billeder på mere stabilt hardware end de disketter og usb-drev, vi andre bruger til feriebillederne. Det betyder også at billederne faktisk spiser brød, dvs koster etellerandet ikke-helt-trivielt beløb pr Gb pr år, så de er sikkert også nødt til at kigge på hvad ting fylder.
Det kan være at de zipper billederne eller kører dedublikering eller ... noget andet, der også har potentialet til at drille dem i fremtiden.


02. jan 2012 kl 09:18

Lindy Madsen

Ang. pris

Om det koster penge at opbevarer pr. år, er jo gætværk.
Det er ikke sikkert de har billederne liggende på en server...

Hvis de bruger en serverløsning, hvor nogle har adgang, sådan at billederne/teksterne kan studeres, så har det en løbende udgift, og som du siger, er det sikkert pr. år... Men jeg vil faktisk tro, at Vatikanet selv sørger for dette, og ikke hyre en udefrakommende og derved tvivlsom løsning.

Den anden løsning er, at opbevare disse filer på et ikke-online system, som skal startes eller filerne på en eller anden måde skal hentes frem fra. Uanset hvad, må man gå ud fra, at backup er sikret på mindst 3 måder og 3 lokationer, for at yde mest sikkerhed. Den sidste løsning har nok også en vedligeholdelsesudgift, men ikke en fast årlig udgift.

Det kommer an på hvor meget de selv står for, og på hvilken måde de opbevarer og sikrer disse data, hvad en evt. udgift vil være på, og hvor tit den skal betales.

Det kunne være interessant at vide mere, men mon ikke at nogle af deres metoder er hemmeligholdte, sådan at de kan have disse data sikrede... Hvis der skulle ske bøgerne noget, er det jo en ret værdifuld mængde data at have, især hvis du kan stjæle dem, og afpresse Vatikanet for en løsesum.


02. jan 2012 kl 09:34

Kaspar Nielsen

Læse FITS filer

Til dem, som er interesserede i at læse FITS filer (med billeder) :

http://www.spacetelescope.org/...tor/

Det virker både på Win og Mac, er gratis og stand-alone (spytter TIFF filer ud).

Mvh
Kaspar


02. jan 2012 kl 11:44

Peter Kyllesbeck

Men kan man læse mediet!

Fint at beskrive i filen, hvordan resten skal fortolkes, men hvis man ikke kan læse filen, så er man da lige vidt! Filformatet, interface til hardware etc skal altså også beskrives. Hver lag i 'løget' skal have en 'fortolkningsvejledning' på ydersiden.


02. jan 2012 kl 13:18

Tom Ringtved

Re: Ang. pris

Om det koster penge at opbevarer pr. år, er jo gætværk.

Det er ikke sikkert de har billederne liggende på en server...



Hvis de bruger en serverløsning, hvor nogle har adgang, sådan at billederne/teksterne kan studeres, så har det en løbende udgift, og som du siger, er det sikkert pr. år... Men jeg vil faktisk tro, at Vatikanet selv sørger for dette, og ikke hyre en udefrakommende og derved tvivlsom løsning.



Den anden løsning er, at opbevare disse filer på et ikke-online system, som skal startes eller filerne på en eller anden måde skal hentes frem fra. Uanset hvad, må man gå ud fra, at backup er sikret på mindst 3 måder og 3 lokationer, for at yde mest sikkerhed. Den sidste løsning har nok også en vedligeholdelsesudgift, men ikke en fast årlig udgift.



Det kommer an på hvor meget de selv står for, og på hvilken måde de opbevarer og sikrer disse data, hvad en evt. udgift vil være på, og hvor tit den skal betales.



Det kunne være interessant at vide mere, men mon ikke at nogle af deres metoder er hemmeligholdte, sådan at de kan have disse data sikrede... Hvis der skulle ske bøgerne noget, er det jo en ret værdifuld mængde data at have, især hvis du kan stjæle dem, og afpresse Vatikanet for en løsesum.

Hvis nu bare vatikanet offentliggjorde det hele ville der ikke være kunne være tale om afpresning. De kunne i øvrigt bare ligge det hele ud på Goggles Picasa. jeg er sikker på Google gerne ville hoste gratis. De har da vist en andet projekt igang med at bevare bøger for eftertiden.


02. jan 2012 kl 17:49

Søren Jespersen

Re: Ang. pris

Vatikanet er nok ikke interesserede i at gamle bøger der modsiger hvad de står for bliver offentligt tilgængelige.


Ny i debatten? Opret en brugerkonto

  • Seneste nyt
  • Mest læste
  • Topdebat
Populært på Facebook
 

Nyhedsbrev

Tilmeld dig vores nyhedsbrev.