Bibliotekaren i generne

Nu er det jo ikke nogen hemmelighed, at der er nogle bestemte områder, som jeg ikke bare er fokuseret på, men også genetisk disponeret for at blive draget mod - som søn af en bibliotekar og en skolelærer. Det lå ligesom i kortene, at jeg ville få en længere uddannelse, og at litteratur nok ville blive involveret.
En mindre ventet effekt (omend det nok var noget, man burde kunne have set på horisonten) var, at jeg undervejs også udviklede en fetish for metadata. Det har manifesteret sig på en række forskellige måder undervejs - jeg har blandt andet fra tid til anden skrevet om bibliografiprogrammer som OOo's bibliografifunktion, Jabref, KBibTeX med videre - men det er min nylige opdagelse af The Open Library, der har sat tankerne i gang.
Open Library er et hjemmeside med et ambitiøst mål: At have en side for enhver bog, der findes. Med billede, beskrivelse, oplagte søgetermer og bibliotekstematiske kategorier. Målet er, at der er en højkvalitetskilde, som biblioteker kan tilgå og hente deres metadata fra, så man har materialet til at lave så fyldestgørende bibliografiske data som muligt. Jeg har bidraget lidt til OL, deriblandt til siden om Catherine Andreyev: Vlasov and the Russian Liberation Movement. Soviet Reality and Emigré Theories, som jeg har fyldt lidt ekstra oplysninger og en indholdsfortegnelse på.
Så langt så værdigt - det er jo ikke et projekt, man kan være uenig i. Man kan måske tro, at det lægger op til en masse arbejde, men ikke nødvendigvis høj kompleksitet. Imidlertid afføder det en længere diskussion om, hvordan man skal forholde sig til sådan nogle data. Og det er her, at der kommer et andet interessant element ind: Bibliotekarers professionalisme... Kigger man på Open Libarys diskussionspostlister (drevet af Mailman, naturligvis), så ser man en længere diskussion om, hvordan man skal forholde sig til dubletter - er en anden version ensbetydende med en anden bog og i forlængelse heraf, hvordan skal man unikt identificere en bog i systemet - hvordan kan man interagere med Google Book Search på en måde, så de faktisk kan få nogle anvendelige metadata og ikke en amputeret version - hvis teksten forefindes til fri benyttelse, skal man så linke/inkludere og så videre. Meget videre.
Hele materialet er udgivet under en Public domain-licens, så det er under alle omstændigheder tilgængeligt til fri anvendelse. Jeg foretrækker jo rutinemæssigt at anvende Creative Commons-licenser, men public domain er jo endnu mere frit... måske. Det er så den diskussion.
Under alle omstændigheder er det et interessant projekt, som jeg holder øje med og bidrager lidt til. Det er ikke gjort mindre interessant af en højtkvalificeret professionel diskussion om, hvordan man skal forholde sig til sådan nogle data.
Desuden har projektet også gjort mig opmærksom på de tekniske implikationer af registrering af biblioteksdata, og selv om det ikke vil være interessant for alle, så har jeg selv fundet en del interessant i Code4lib-magasinet - naturligvis mest med de principielle artikler, eftersom jeg jo ikke ligefrem er biblioteks-hacker - og Karen Coyles hjemmeside. Hun er den store metadata-guru hos OpenLibrary.