Una Interfaccia Europea di una Biblioteca Digitale Internazionale

 

Maria Bruna Baldacci, Stefania Biagioni, Carlo Carlesi, Donatella Castelli, Carol Peters

Istituto di Elaborazione della Informazione del CNR, Pisa, Italy

baldacci,biagioni,carlesi,castelli,carol@iei.pi.cnr.it

Sommario

Obiettivo principale del lavoro e’ la descrizione delle problematiche emerse durante la realizzazione di una biblioteca digitale di letteratura grigia di informatica e matematica applicata (ERCIM Technical Reference Digital Library — ETRDL) e della sua interfaccia utente. In particolare vengono riportate le motivazioni di alcune scelte operate nel disegnare e realizzare i diversi moduli dell’interfaccia.

1. Introduzione Benche’ non esista ancora una definizione riconosciuta dalla comunita’ internazionale, una "biblioteca digitale" puo’ essere intesa come un sistema che compie le funzioni fondamentali di una biblioteca nel contesto di collezioni di documenti digitali distribuite in rete.

Il riferimento alle funzioni fondamentali di una biblioteca, tuttavia, non ci aiuta ad intuire ne’ le potenzialita’ delle biblioteche digitali, ne’ la novita’ dei problemi posti dalla presenza di "documenti fisici" di natura cosi’ diversa dai documenti cartacei tradizionali. Infatti i sistemi informativi per le biblioteche tradizionali, e quindi le loro interfacce, hanno per oggetto "rappresentazioni" di documenti, mentre i documenti fisici — libri, riviste, etc. — sono sottoposti ad operazioni manuali; paradossalmente, lo stesso atto della "lettura", e’ reso possibile da una serie di operazioni manuali. La presenza di documenti di cosi’ diversa natura fisica, caratteristica principale delle biblioteche digitali, ha molteplici implicazioni, non solo di ordine tecnologico. Rispetto alla unicita’ e stabilita’ dell’opera a stampa, i documenti elettronici presentano caratteristiche di dinamicita’, accessibilita’, modalita’ di fruizione che richiedono di affrontare tematiche quali sicurezza, controllo delle versioni, diritti di autore, etc, tradizionalmente estranee ai sistemi informativi bibliotecari. E queste nuove modalita’ di gestire il ciclo dell’informazione — creazione, manutenzione, distribuzione, controllo, uso — si riflettono necessariamente sulla concezione delle interfacce, che nel nuovo contesto devono rivolgersi a nuove categorie di "utenti" — non solo a quelli che ricercano informazioni, ma anche a quelli che le creano e le gestiscono — ed offrire nuove funzionalita’ .

In generale si puo’ dire che la nuova "fisicita’" dei documenti impone la riprogettazione dell’architettura dei sistemi di gestione, la riformulazione in termini funzionali dei servizi da erogare alle varie tipologie di utenti, la necessita’ di standard per l’interoperabilita’ dei diversi sistemi, la definizione di interfacce che offrano, oltre alle tradizionali funzioni di recupero dell’informazione, funzionalita’ per la "visualizzazione / lettura" dei documenti elettronici, per la loro acquisizione e la gestione delle procedure di carattere amministrativo che li riguardano, e altre ancora.

Per la complessita’ e la varieta’ dei temi da affrontare, la sperimentazione procede a piccoli passi. Una delle realizzazioni che ha raggiunto lo stadio operativo e’ la biblioteca digitale Networked Computer Science Technical Reference Library - NCSTRL [1], basata sul sistema Dienst [2,3]. Dienst e’ una architettura per biblioteche digitali sviluppata alla Cornell University, che fornisce l’accesso a collezioni distribuite e decentralizzate di documenti multi formato, via World Wide Web. All’interno di un accordo internazionale fra NCSTRL e ERCIM, le funzioni base del software Dienst sono state utilizzate in un progetto per realizzare il polo europeo di NCSTRL: ERCIM Technical Reference Digital Library - ETRDL [4]. La componente italiana di ETRDL e’ costituita dai rapporti di informatica e matematica applicata prodotti dagli Istituti CNR che afferiscono al "Progetto Dienst" [5].

I servizi di NCSTRL, tuttavia, non si sono dimostrati capaci di rispondere a tutti requisiti della biblioteca digitale pensata dai bibliotecari e dagli utenti ERCIM. Obiettivo principale del lavoro per la costituzione di ETRDL e’ stata la realizzazione di un interfaccia corrispondente a tali requisiti. Questo ha anche comportato la realizzazione di un particolare ambiente di lavoro che presenta la collezione ERCIM come un sottinsieme di NCSTRL ma con specifiche funzionalita’ [6].

I paragrafi che seguono descrivono sinteticamente l’interfaccia di ETRDL, comune a tutti gli utenti europei, realizzata per consentire le operazioni di creazione, ricerca, accesso e gestione della biblioteca digitale. In particolare vengono riportate le motivazioni di alcune scelte operate nel disegnare e implementare l’interfaccia.

2. Gli utenti di ETRDL Possono essere individuate tre classi di utenti della biblioteca digitale della comunita’ scientifica ERCIM:

Per dare la possibilita’ alle diverse categorie di utenti di lavorare in un ambiente a loro congeniale quale e’ il WWW, abbiamo costruito un sistema che presenta una interfaccia di ricerca, recupero e visualizzazione, una interfaccia per la catalogazione e l’invio del documento e una interfaccia per l’amministrazione.

Di seguito vengono descritte brevemente le funzionalita’ della interfaccia di ETRDL, accessibile all’indirizzo: http://www.iei.pi.cnr.it/DELOS.

3. La progettazione dell’interfaccia di ETRDL Dall’analisi delle necessita’ degli utenti europei, sono emersi numerosi requisiti specifici rispetto ad NCSTRL quali: l’adozione di uno standard di metadati, l’introduzione di uno schema di classificazione comune, la realizzazione di interfacce multilingue.

Per soddisfare i suddetti requisiti e’ stato necessario modificare il sistema Dienst (versione 4.1.9) e realizzare una nuova interfaccia. Il punto piu’ delicato di questa operazione e’ stato realizzare l’interfaccia senza intervenire troppo pesantemente sull’architettura del sistema sottostante e nel contempo mantenere una certa uniformita’ con NCSTRL.

L’interfaccia utente e’ composta principalmente di tre nuovi moduli: (i) catalogazione e invio del documento, (ii) ricerca e il recupero dei documenti e (iii) amministrazione della collezione.

La caratteristica principale dell’interfaccia utente e’ quella di essere amichevole e di fornire, passo per passo, dettagliati help in linea. Non e’ infatti necessaria una speciale conoscenza per interrogare la collezione, per presentare un documento al sistema o per verificare e inserire un documento.

3.1 La pagina di catalogazione e invio dei documenti Nelle biblioteche digitali, puo’ essere l’autore del documento a svolgere il ruolo di editore e di catalogatore della risorsa informativa, e questo e’ quanto avviene nella biblioteca ETRDL con la funzionalita’ di "Catalogazione e invio " dei documenti nel sistema. Ogni nuovo documento che viene memorizzato in una delle collezioni di ETRDL deve essere accompagnato dalla relativa scheda bibliografica. I formati del documento possono esssere scelti fra: PS, PDF, JPEG, TXT, HTML, TIFF.

La progettazione di questa pagina ha richiesto particolari accorgimenti al fine di semplificare il lavoro dell’autore e di costruire "rappresentazioni" dei documenti omogenei con gli standard che si stanno affermando. I documenti delle biblioteche digitali possono infatti essere di tipologie assai diverse dai "testi" che costituiscono per la maggior parte il patrimonio documentale delle biblioteche tradizionali e questo ha spinto la comunita’ internazionale a progettare nuove regole di rappresentazione delle risorse informative accessibili dalla rete - le piu’ note sono quelle definite nel "Dublin Core Metadata Set "[7], di fatto divenuto uno standard internazionale, - e nuovi meccanismi per ricercarle. Anche se nello stadio attuale ETRDL accoglie esclusivamente informazioni testuali, si e’ ritenuto opportuno rappresentare i documenti attraverso gli elementi del "Dublin Core".

Per aiutare l’autore in queste sue "nuove" attivita’, la pagina di catalogazione e invio fornisce "help" in linea per guidare l’autore sia nella definizione dei formati del documento, sia nella compilazione della scheda bibliografica; in particolare la pagina permette la ricerca/browsing degli schemi di classificazione e l’eventuale inserimento dei dati con meccanismi "cut and paste". Al termine della fase di catalogazione e invio del documento intervengono inoltre procedure di verifica dei valori della scheda bibliografica che informano l’autore di eventuali errori od omissioni.

3.2 La pagina di ricerca Anche nelle biblioteche digitali la funzione di ricerca e recupero dell’informazione si svolge su "rappresentazioni" di documenti, ed e’ pertanto meno soggetta ai mutamenti imposti dal nuovo stato fisico dei documenti.

Per dare all’utente la visione di un ambiente di ricerca uniforme abbiamo cercato di mantenere, per quanto possibile, una omogeneita’ con la pagina di ricerca di NCSTRL. Questo ci ha suggerito, ad esempio, di mantenere la suddivisione nei tre tipi di ricerca: direct search, simple search e fielded search, come nella versione originale di Dienst.

La parte dell’interfaccia utente relativa a fielded search contiene invece funzionalita’ specifiche che la differenziano da quella di NCSTRL. Per prima cosa essa permette la ricerca su un insieme di campi più ampio. Ai campi presenti in NCSTRL - author, title e abstract - sono stati aggiunti anche subject (esprimibile con i codici di classificazione ACM e AMS o con parole libere), language , document type e date.

Caratteristica dell’ambiente di una biblioteca digitale e’ invece la funzionalita’ del recupero dei documenti, che segue logicamente la tradizionale fase del recupero dell’informazione sui documenti. E’ infatti opportuno che l’utente, possa verificare sullo schermo l’interesse del documento recuperato, prima di scaricarlo sul disco locale. A tal fine il sistema permette di esaminare il documento con diverse modalita’, nella sua interezza o pagina per pagina.

3.3. La pagina di amministrazione della collezione Le funzioni di verifica e di controllo dei documenti inseriti dagli autori, esigenza specifica dell’ambiente ETRDL, sono state realizzate con un nuovo modulo, aggiunto alla versione originale di Dienst, e rese accessibili via WWW attraverso una pagina riservata all’amministratore del sistema, di regola un bibliotecario. Le funzioni rilasciate sono:

4. Il multilinguismo dell’interfaccia Il multilinguismo e’ una questione di importanza strategica per la comunita’ scientifica ERCIM, che e’ attualmente composta da Istituzioni che usano 13 lingue europee diverse. In questo settore le attivita’ iniziali per ETRDL prevedono la realizzazione di una interfaccia capace di gestire piu’ di una lingua e di fornire le funzionalita’ di base per le interrogazioni in lingue diverse. Lo sviluppo di una interfaccia multilingue e’ motivata inoltre dal fatto che il sistema, sebbene attualmente rivolto alla gestione della documentazione nel campo delle tecnologie dell’informazione - un’ area in cui l’inglese e’ la lingua dominante - dovra’ trovare applicazioni in campi di ricerca dove altre lingue - inclusa la lingua italiana - giocano ruoli piu’ importanti.

4.1 Interfaccia Multilingue Ciascun sito nazionale e’ responsabile della installazione di una interfaccia utente inglese e di una analoga interfaccia nella propria lingua. L’utente puo’ scegliere di usare quella che ritiene piu’ conveniente fra le due interfacce.

Tutte le interfacce utente sono generate dinamicamente run-time. La scelta di una lingua non solo determina la lingua degli identificatori associati ai campi ma anche quella dei messaggi che vengono restituiti dal sistema.

Una questione piu’ complessa da trattare sia a livello di sistema sia di interfaccia e’ la capacita’ di gestire e visualizzare set di caratteri multipli. A ciascun documento inserito nella collezione ETRDL e’ associata l’informazione della lingua in cui esso e’ scritto. Attualmente, appropriati meccanismi vengono forniti per visualizzare e stampare localmente i caratteri che non appartengono alla classe Latin-1: un prototipo di tale meccanismo e’ stato realizzato all’istituto ICS-FORTH. E’ in fase di studio l’uso dello standard Unicode.

4.2 Ricerca Multilingue. Attualmente e’ stata realizzata una forma semplice di interrogazione "cross-language" usando i codici/descrittori degli schemi di classificazione dell’ACM e dell’AMS: tutti i documenti in ETRDL, in qualsiasi lingua siano scritti, possono essere ricercati con i termini di tali linguaggi controllati. Inoltre, poiche’ agli autori e’ richiesto di inserire almeno un sommario in inglese, con i termini liberi di tale lingua e’ possibile fare una ricerca su documenti scritti in qualsiasi altra lingua.

5. La nostra esperienza L’insegnamento principale che abbiamo tratto dal lavoro di realizzazione delle interfacce di ETRDL e’ l’esperienza di quanto tale lavoro sia condizionato dalle caratteristiche del sistema da interfacciare. Nel passato abbiamo fatto una esperienza positiva nella costruzione di una unica interfaccia per sistemi diversi [8,9], oggi, al contrario, abbiamo incontrato difficolta’ a costruire una interfaccia per un unico sistema: benche’ Dienst si presenti come sistema aperto a specifiche estensioni, la sua architettura non e’ modulare e l’interfaccia, percio’, non ha potuto essere progettata come oggetto distinto dal sistema sottostante

Abbiamo anche fatto esperienza che, come insegna la letteratura, nel passaggio dalla definizione dei requisiti di un sistema ad una implementazione atta a risolvere problemi del mondo reale si incontrano una serie di fattori - tipici sono i tempi e i costi di realizzazione - che condizionano scelte e soluzioni.

L’interfaccia utente presentata e’ il risultato della prima fase della sperimentazione. Sebbene l’interfaccia sia stata realizzata con tecnologie "classiche", essa offre, via WWW, le funzionalita’ essenziali di catalogazione, invio, inserimento, ricerca/recupero e amministrazione dei documenti.

Alle funzioni del sistema Dienst originale abbiamo aggiunto la funzione di ricerca con vocabolario controllato, interfacce multilingue, funzionalita’ in-linea per la registrazione e la correzione dei documenti, da parte degli autori, e la gestione della collezione dei documenti da parte dell’amministratore. Queste nuove funzionalita’ sono state presentate con interfacce orientate a diversi profili di utenti.

Durante l’implementazione abbiamo dovuto riscontrare che molti degli assunti di partenza non tenevano conto della complessita’ del sistema che stavamo sviluppando, e questo ha comportato, dopo la definizione dei requisiti e l’implementazione, la ripetizione del classico ciclo " distribuzione del sistema e test - revisione del sistema in accordo con i feedback". Alla fine di questa esperienza - che all’inizio ci ha forse visti un po’ piu’ ottimisti - possiamo dire di essere piu’ consapevoli della complessita’ degli obiettivi che ci eravamo dati.

6. Sviluppi futuri L’attivita’ futura si concentrera’ da una parte nella manutenzione e operativita’ della biblioteca digitale e dall’altra nell’estensione e/o riprogettazione dell’interfaccia. Infatti con l’aumentare della quantita’ dei documenti nella collezione, potranno essere fatti esperimenti di usabilita’ piu’ vasti ed affidabili i cui risultati potranno indirizzare i criteri di progetto della nuova interfaccia.

Le fasi successive della sperimentazione tenderanno ad estendere l’interfaccia utente esistente in modo da renderla sempre di piu’ vicina ad un vero e proprio ambiente di lavoro. In particolare, verranno aggiunte quelle funzionalita’ che rispondono ai requisiti dettati dalla nuova fisicita’ dei documenti e dal nuovo modo di operare su di essi. Attualmente, alcune di queste estensioni sono in corso di studio di fattibilita’; tra queste le seguenti:

Bibliografia

[1] Networked Computer Science Technical Report Library. http://www.ncstrl.org

[2] C. Lagoze, J. R. Davis, "Dienst: an Architecture for Distributed Document Libraries", Communications of the ACM, 38 (4) April 1995, p. 45.

[3] C. Lagoze, E. Shaw, J. R. Davis, and D. B. Krafft, "Dienst Implementation Reference Manual," Cornell University Computer Science, Technical Report TR95-1514, May 1995.

[4] S.Biagioni, J. Borbinha, R. Ferber, P. Hansen, S. Kapidakis, L. Kovacs, F. Roos, A.M. Vercoustre, (1998). "The ERCIM Technical Reference Digital Library". in ECDL’98 Proceedings, Crete, Greece, September 1998, pp. 905-906.

http://www.iei.pi.cnr.it/DELOS/EDL/ETRDL98.html.

[5] S.Biagioni, "Progetto di infrastruttura per la realizzazione di un sistema informativo sperimentale per l’acquisizione, la gestione e l’accesso in rete geografica dei rapporti tecnici prodotti nei settori dell’informatica e della matematica applicata". IEI-CNR, Dicembre 1997, B4-34.

[6] M.B. Baldacci, S. Biagioni, C. Carlesi, D. Castelli, C. Peters. (1998). "Implementing the Common User Interface for a Digital Library: The ETRDL experience", Eighth DELOS Workshop: User Interfaces in Digital Libraries. Stockholm, 21-23 October 1998 - No.98/W005 - ISBN 2-912335-07-8.

[7] Dublin Core Metadata Element Set: Resource Page. http://purl.org/metadata/dublincore.

[8] M.B. Baldacci, D . Castelli, A. Catoni, J. Favaro, M. Loffredo, I. Lopez De Sosoaga, G.A. Romano, O. Signore.Arca Architectural Design. Libraries Programme Project Lib-Arca2-3009, Arca/T12/ADD, November 1995.

[9] M.B. Baldacci, D. Castelli, P. Pagano "ARCA target configuration interface design document", Libraries Programme Project Lib-Arca2-3009, Arca/T141/TID (May 1997).

[10] B. Masand, G. Linoff, D. Waltz, "Classifying news stories using memory-based reasoning", Proceedings of SIGIR-92, 15th ACM International Conference on Research and Development in Information Retrieval, 1992. Kobenhavn, DK, p.59-65.

[11] Y. Yang, "Expert network: effective and efficient learning from human decisions in text categorisation and retrieval", Proceedings of SIGIR-94, 17th ACM International Conference on Research and Development in Information Retrieval, Dublin, IE, p. 13-22".