Una Interfaccia Europea di una Biblioteca Digitale Internazionale
Maria Bruna Baldacci, Stefania Biagioni, Carlo Carlesi, Donatella Castelli, Carol Peters
Istituto di Elaborazione della Informazione del CNR, Pisa, Italy
baldacci,biagioni,carlesi,castelli,carol@iei.pi.cnr.it
Sommario
Obiettivo principale del lavoro e la descrizione delle problematiche emerse durante la realizzazione di una biblioteca digitale di letteratura grigia di informatica e matematica applicata (ERCIM Technical Reference Digital Library ETRDL) e della sua interfaccia utente. In particolare vengono riportate le motivazioni di alcune scelte operate nel disegnare e realizzare i diversi moduli dellinterfaccia.
1. Introduzione Benche non esista ancora una definizione riconosciuta dalla comunita internazionale, una "biblioteca digitale" puo essere intesa come un sistema che compie le funzioni fondamentali di una biblioteca nel contesto di collezioni di documenti digitali distribuite in rete.
Il riferimento alle funzioni fondamentali di una biblioteca, tuttavia, non ci aiuta ad intuire ne le potenzialita delle biblioteche digitali, ne la novita dei problemi posti dalla presenza di "documenti fisici" di natura cosi diversa dai documenti cartacei tradizionali. Infatti i sistemi informativi per le biblioteche tradizionali, e quindi le loro interfacce, hanno per oggetto "rappresentazioni" di documenti, mentre i documenti fisici libri, riviste, etc. sono sottoposti ad operazioni manuali; paradossalmente, lo stesso atto della "lettura", e reso possibile da una serie di operazioni manuali. La presenza di documenti di cosi diversa natura fisica, caratteristica principale delle biblioteche digitali, ha molteplici implicazioni, non solo di ordine tecnologico. Rispetto alla unicita e stabilita dellopera a stampa, i documenti elettronici presentano caratteristiche di dinamicita, accessibilita, modalita di fruizione che richiedono di affrontare tematiche quali sicurezza, controllo delle versioni, diritti di autore, etc, tradizionalmente estranee ai sistemi informativi bibliotecari. E queste nuove modalita di gestire il ciclo dellinformazione creazione, manutenzione, distribuzione, controllo, uso si riflettono necessariamente sulla concezione delle interfacce, che nel nuovo contesto devono rivolgersi a nuove categorie di "utenti" non solo a quelli che ricercano informazioni, ma anche a quelli che le creano e le gestiscono ed offrire nuove funzionalita .
In generale si puo dire che la nuova "fisicita" dei documenti impone la riprogettazione dellarchitettura dei sistemi di gestione, la riformulazione in termini funzionali dei servizi da erogare alle varie tipologie di utenti, la necessita di standard per linteroperabilita dei diversi sistemi, la definizione di interfacce che offrano, oltre alle tradizionali funzioni di recupero dellinformazione, funzionalita per la "visualizzazione / lettura" dei documenti elettronici, per la loro acquisizione e la gestione delle procedure di carattere amministrativo che li riguardano, e altre ancora.
Per la complessita e la varieta dei temi da affrontare, la sperimentazione procede a piccoli passi. Una delle realizzazioni che ha raggiunto lo stadio operativo e la biblioteca digitale Networked Computer Science Technical Reference Library - NCSTRL [1], basata sul sistema Dienst [2,3]. Dienst e una architettura per biblioteche digitali sviluppata alla Cornell University, che fornisce laccesso a collezioni distribuite e decentralizzate di documenti multi formato, via World Wide Web. Allinterno di un accordo internazionale fra NCSTRL e ERCIM, le funzioni base del software Dienst sono state utilizzate in un progetto per realizzare il polo europeo di NCSTRL: ERCIM Technical Reference Digital Library - ETRDL [4]. La componente italiana di ETRDL e costituita dai rapporti di informatica e matematica applicata prodotti dagli Istituti CNR che afferiscono al "Progetto Dienst" [5].
I servizi di NCSTRL, tuttavia, non si sono dimostrati capaci di rispondere a tutti requisiti della biblioteca digitale pensata dai bibliotecari e dagli utenti ERCIM. Obiettivo principale del lavoro per la costituzione di ETRDL e stata la realizzazione di un interfaccia corrispondente a tali requisiti. Questo ha anche comportato la realizzazione di un particolare ambiente di lavoro che presenta la collezione ERCIM come un sottinsieme di NCSTRL ma con specifiche funzionalita [6].
I paragrafi che seguono descrivono sinteticamente linterfaccia di ETRDL, comune a tutti gli utenti europei, realizzata per consentire le operazioni di creazione, ricerca, accesso e gestione della biblioteca digitale. In particolare vengono riportate le motivazioni di alcune scelte operate nel disegnare e implementare linterfaccia.
2. Gli utenti di ETRDL Possono essere individuate tre classi di utenti della biblioteca digitale della comunita scientifica ERCIM:
Per dare la possibilita alle diverse categorie di utenti di lavorare in un ambiente a loro congeniale quale e il WWW, abbiamo costruito un sistema che presenta una interfaccia di ricerca, recupero e visualizzazione, una interfaccia per la catalogazione e linvio del documento e una interfaccia per lamministrazione.
Di seguito vengono descritte brevemente le funzionalita della interfaccia di ETRDL, accessibile allindirizzo: http://www.iei.pi.cnr.it/DELOS.
3. La progettazione dellinterfaccia di ETRDL Dallanalisi delle necessita degli utenti europei, sono emersi numerosi requisiti specifici rispetto ad NCSTRL quali: ladozione di uno standard di metadati, lintroduzione di uno schema di classificazione comune, la realizzazione di interfacce multilingue.
Per soddisfare i suddetti requisiti e stato necessario modificare il sistema Dienst (versione 4.1.9) e realizzare una nuova interfaccia. Il punto piu delicato di questa operazione e stato realizzare linterfaccia senza intervenire troppo pesantemente sullarchitettura del sistema sottostante e nel contempo mantenere una certa uniformita con NCSTRL.
Linterfaccia utente e composta principalmente di tre nuovi moduli: (i) catalogazione e invio del documento, (ii) ricerca e il recupero dei documenti e (iii) amministrazione della collezione.
La caratteristica principale dellinterfaccia utente e quella di essere amichevole e di fornire, passo per passo, dettagliati help in linea. Non e infatti necessaria una speciale conoscenza per interrogare la collezione, per presentare un documento al sistema o per verificare e inserire un documento.
3.1 La pagina di catalogazione e invio dei documenti Nelle biblioteche digitali, puo essere lautore del documento a svolgere il ruolo di editore e di catalogatore della risorsa informativa, e questo e quanto avviene nella biblioteca ETRDL con la funzionalita di "Catalogazione e invio " dei documenti nel sistema. Ogni nuovo documento che viene memorizzato in una delle collezioni di ETRDL deve essere accompagnato dalla relativa scheda bibliografica. I formati del documento possono esssere scelti fra: PS, PDF, JPEG, TXT, HTML, TIFF.
La progettazione di questa pagina ha richiesto particolari accorgimenti al fine di semplificare il lavoro dellautore e di costruire "rappresentazioni" dei documenti omogenei con gli standard che si stanno affermando. I documenti delle biblioteche digitali possono infatti essere di tipologie assai diverse dai "testi" che costituiscono per la maggior parte il patrimonio documentale delle biblioteche tradizionali e questo ha spinto la comunita internazionale a progettare nuove regole di rappresentazione delle risorse informative accessibili dalla rete - le piu note sono quelle definite nel "Dublin Core Metadata Set "[7], di fatto divenuto uno standard internazionale, - e nuovi meccanismi per ricercarle. Anche se nello stadio attuale ETRDL accoglie esclusivamente informazioni testuali, si e ritenuto opportuno rappresentare i documenti attraverso gli elementi del "Dublin Core".
Per aiutare lautore in queste sue "nuove" attivita, la pagina di catalogazione e invio fornisce "help" in linea per guidare lautore sia nella definizione dei formati del documento, sia nella compilazione della scheda bibliografica; in particolare la pagina permette la ricerca/browsing degli schemi di classificazione e leventuale inserimento dei dati con meccanismi "cut and paste". Al termine della fase di catalogazione e invio del documento intervengono inoltre procedure di verifica dei valori della scheda bibliografica che informano lautore di eventuali errori od omissioni.
3.2 La pagina di ricerca Anche nelle biblioteche digitali la funzione di ricerca e recupero dellinformazione si svolge su "rappresentazioni" di documenti, ed e pertanto meno soggetta ai mutamenti imposti dal nuovo stato fisico dei documenti.
Per dare allutente la visione di un ambiente di ricerca uniforme abbiamo cercato di mantenere, per quanto possibile, una omogeneita con la pagina di ricerca di NCSTRL. Questo ci ha suggerito, ad esempio, di mantenere la suddivisione nei tre tipi di ricerca: direct search, simple search e fielded search, come nella versione originale di Dienst.
La parte dellinterfaccia utente relativa a fielded search contiene invece funzionalita specifiche che la differenziano da quella di NCSTRL. Per prima cosa essa permette la ricerca su un insieme di campi più ampio. Ai campi presenti in NCSTRL - author, title e abstract - sono stati aggiunti anche subject (esprimibile con i codici di classificazione ACM e AMS o con parole libere), language , document type e date.
Caratteristica dellambiente di una biblioteca digitale e invece la funzionalita del recupero dei documenti, che segue logicamente la tradizionale fase del recupero dellinformazione sui documenti. E infatti opportuno che lutente, possa verificare sullo schermo linteresse del documento recuperato, prima di scaricarlo sul disco locale. A tal fine il sistema permette di esaminare il documento con diverse modalita, nella sua interezza o pagina per pagina.
3.3. La pagina di amministrazione della collezione Le funzioni di verifica e di controllo dei documenti inseriti dagli autori, esigenza specifica dellambiente ETRDL, sono state realizzate con un nuovo modulo, aggiunto alla versione originale di Dienst, e rese accessibili via WWW attraverso una pagina riservata allamministratore del sistema, di regola un bibliotecario. Le funzioni rilasciate sono:
4. Il multilinguismo dellinterfaccia Il multilinguismo e una questione di importanza strategica per la comunita scientifica ERCIM, che e attualmente composta da Istituzioni che usano 13 lingue europee diverse. In questo settore le attivita iniziali per ETRDL prevedono la realizzazione di una interfaccia capace di gestire piu di una lingua e di fornire le funzionalita di base per le interrogazioni in lingue diverse. Lo sviluppo di una interfaccia multilingue e motivata inoltre dal fatto che il sistema, sebbene attualmente rivolto alla gestione della documentazione nel campo delle tecnologie dellinformazione - un area in cui linglese e la lingua dominante - dovra trovare applicazioni in campi di ricerca dove altre lingue - inclusa la lingua italiana - giocano ruoli piu importanti.
4.1 Interfaccia Multilingue Ciascun sito nazionale e responsabile della installazione di una interfaccia utente inglese e di una analoga interfaccia nella propria lingua. Lutente puo scegliere di usare quella che ritiene piu conveniente fra le due interfacce.
Tutte le interfacce utente sono generate dinamicamente run-time. La scelta di una lingua non solo determina la lingua degli identificatori associati ai campi ma anche quella dei messaggi che vengono restituiti dal sistema.
Una questione piu complessa da trattare sia a livello di sistema sia di interfaccia e la capacita di gestire e visualizzare set di caratteri multipli. A ciascun documento inserito nella collezione ETRDL e associata linformazione della lingua in cui esso e scritto. Attualmente, appropriati meccanismi vengono forniti per visualizzare e stampare localmente i caratteri che non appartengono alla classe Latin-1: un prototipo di tale meccanismo e stato realizzato allistituto ICS-FORTH. E in fase di studio luso dello standard Unicode.
4.2 Ricerca Multilingue. Attualmente e stata realizzata una forma semplice di interrogazione "cross-language" usando i codici/descrittori degli schemi di classificazione dellACM e dellAMS: tutti i documenti in ETRDL, in qualsiasi lingua siano scritti, possono essere ricercati con i termini di tali linguaggi controllati. Inoltre, poiche agli autori e richiesto di inserire almeno un sommario in inglese, con i termini liberi di tale lingua e possibile fare una ricerca su documenti scritti in qualsiasi altra lingua.
5. La nostra esperienza Linsegnamento principale che abbiamo tratto dal lavoro di realizzazione delle interfacce di ETRDL e lesperienza di quanto tale lavoro sia condizionato dalle caratteristiche del sistema da interfacciare. Nel passato abbiamo fatto una esperienza positiva nella costruzione di una unica interfaccia per sistemi diversi [8,9], oggi, al contrario, abbiamo incontrato difficolta a costruire una interfaccia per un unico sistema: benche Dienst si presenti come sistema aperto a specifiche estensioni, la sua architettura non e modulare e linterfaccia, percio, non ha potuto essere progettata come oggetto distinto dal sistema sottostante
Abbiamo anche fatto esperienza che, come insegna la letteratura, nel passaggio dalla definizione dei requisiti di un sistema ad una implementazione atta a risolvere problemi del mondo reale si incontrano una serie di fattori - tipici sono i tempi e i costi di realizzazione - che condizionano scelte e soluzioni.
Linterfaccia utente presentata e il risultato della prima fase della sperimentazione. Sebbene linterfaccia sia stata realizzata con tecnologie "classiche", essa offre, via WWW, le funzionalita essenziali di catalogazione, invio, inserimento, ricerca/recupero e amministrazione dei documenti.
Alle funzioni del sistema Dienst originale abbiamo aggiunto la funzione di ricerca con vocabolario controllato, interfacce multilingue, funzionalita in-linea per la registrazione e la correzione dei documenti, da parte degli autori, e la gestione della collezione dei documenti da parte dellamministratore. Queste nuove funzionalita sono state presentate con interfacce orientate a diversi profili di utenti.
Durante limplementazione abbiamo dovuto riscontrare che molti degli assunti di partenza non tenevano conto della complessita del sistema che stavamo sviluppando, e questo ha comportato, dopo la definizione dei requisiti e limplementazione, la ripetizione del classico ciclo " distribuzione del sistema e test - revisione del sistema in accordo con i feedback". Alla fine di questa esperienza - che allinizio ci ha forse visti un po piu ottimisti - possiamo dire di essere piu consapevoli della complessita degli obiettivi che ci eravamo dati.
6. Sviluppi futuri Lattivita futura si concentrera da una parte nella manutenzione e operativita della biblioteca digitale e dallaltra nellestensione e/o riprogettazione dellinterfaccia. Infatti con laumentare della quantita dei documenti nella collezione, potranno essere fatti esperimenti di usabilita piu vasti ed affidabili i cui risultati potranno indirizzare i criteri di progetto della nuova interfaccia.
Le fasi successive della sperimentazione tenderanno ad estendere linterfaccia utente esistente in modo da renderla sempre di piu vicina ad un vero e proprio ambiente di lavoro. In particolare, verranno aggiunte quelle funzionalita che rispondono ai requisiti dettati dalla nuova fisicita dei documenti e dal nuovo modo di operare su di essi. Attualmente, alcune di queste estensioni sono in corso di studio di fattibilita; tra queste le seguenti:
Bibliografia
[1] Networked Computer Science Technical Report Library.
http://www.ncstrl.org[2] C. Lagoze, J. R. Davis, "Dienst: an Architecture for Distributed Document Libraries", Communications of the ACM, 38 (4) April 1995, p. 45.
[3] C. Lagoze, E. Shaw, J. R. Davis, and D. B. Krafft, "Dienst Implementation Reference Manual," Cornell University Computer Science, Technical Report TR95-1514, May 1995.
[4] S.Biagioni, J. Borbinha, R. Ferber, P. Hansen, S. Kapidakis, L. Kovacs, F. Roos, A.M. Vercoustre, (1998). "The ERCIM Technical Reference Digital Library". in ECDL98 Proceedings, Crete, Greece, September 1998, pp. 905-906.
http://www.iei.pi.cnr.it/DELOS/EDL/ETRDL98.html.
[5] S.Biagioni, "Progetto di infrastruttura per la realizzazione di un sistema informativo sperimentale per lacquisizione, la gestione e laccesso in rete geografica dei rapporti tecnici prodotti nei settori dellinformatica e della matematica applicata". IEI-CNR, Dicembre 1997, B4-34.
[6] M.B. Baldacci, S. Biagioni, C. Carlesi, D. Castelli, C. Peters. (1998). "Implementing the Common User Interface for a Digital Library: The ETRDL experience", Eighth DELOS Workshop: User Interfaces in Digital Libraries. Stockholm, 21-23 October 1998 - No.98/W005 - ISBN 2-912335-07-8.
[7] Dublin Core Metadata Element Set: Resource Page.
http://purl.org/metadata/dublincore.[8] M.B. Baldacci, D . Castelli, A. Catoni, J. Favaro, M. Loffredo, I. Lopez De Sosoaga, G.A. Romano, O. Signore.Arca Architectural Design. Libraries Programme Project Lib-Arca2-3009, Arca/T12/ADD, November 1995.
[9] M.B. Baldacci, D. Castelli, P. Pagano "ARCA target configuration interface design document", Libraries Programme Project Lib-Arca2-3009, Arca/T141/TID (May 1997).
[10] B. Masand, G. Linoff, D. Waltz, "Classifying news stories using memory-based reasoning", Proceedings of SIGIR-92, 15th ACM International Conference on Research and Development in Information Retrieval, 1992. Kobenhavn, DK, p.59-65.
[11] Y. Yang, "Expert network: effective and efficient learning from human decisions in text categorisation and retrieval", Proceedings of SIGIR-94, 17th ACM International Conference on Research and Development in Information Retrieval, Dublin, IE, p. 13-22".