Machine learning e open data sono termini che ancora faticano a essere associati al mondo delle biblioteche. Un mondo che oggi avrebbe disposizione una grande quantità di dati relativi alle abitudini di lettura degli utenti che potrebbero trovare interessanti applicazioni nell’implementazione di nuovi servizi, ma che purtroppo restano quasi del tutto inutilizzati. I content provider privati inoltre fanno largo uso del machine learning – termine che identifica l’apprendimento automatico, un campo dell’Intelligenza artificiale che si occupa di realizzare algoritmi in grado di apprendere dai dati e di migliorare così la propria performance nel tempo. Un campo di applicazioni che invece non trova ancora applicazione nell’ambito dei servizi bibliotecari pubblici.
«Oggi le biblioteche sono indietro rispetto agli operatori commerciali per quanto riguarda le modalità di trattamento dei dati – afferma Giulio Blasi, CEO di Horizons Unlimited l’azienda che ha attivato il servizio MLOL (MediaLibraryOnLine), il primo network nazionale di biblioteche digitali di pubblica lettura –. Diventa quindi sempre più evidente l’importanza di portare innovazione nel settore. I dati sulla lettura che possono essere utilizzati sono ancora troppo pochi, nonostante le biblioteche ne abbiano una grande quantità. Per questo sarebbe importante avviare una campagna a favore degli open data bibliotecari. Quando parlo di open data non penso solo ai record bibliografici, ma soprattutto alle transazioni bibliotecarie anonimizzate. Se tutti questi dati fossero disponibili in modo aperto e riutilizzabili senza limitazioni, si potrebbe generare un vantaggio per l’intero ecosistema della lettura. Un tema fondamentale è anche quello delle raccomandazioni. Finora sono state sviluppate in ambito commerciale con obiettivi ben diversi da quelli che si pone una biblioteca. È possibile però sviluppare raccomandazioni che lavorino con obiettivi non commerciali? La risposta è sicuramente positiva: l’ottimizzazione della circolazione può essere uno di questi obiettivi, ma anche l’analisi dell’acquisto dei titoli da parte dei bibliotecari (un aspetto che ancora oggi è legato soprattutto al fiuto del bibliotecario)».
Il mondo dei lettori ha un tale livello di complessità che non può più essere controllato «a naso» dal bibliotecario, per quanto bravo possa essere. Si tratta quindi di innescare meccanismi di monitoraggio e controllo, così da far diventare le biblioteche organizzazioni davvero basate sui dati.
«Aprire in maniera intelligente il settore dell’informazione – sottolinea Andrea Zanni, product manager di Horizons Unlimited ed ex presidente di Wikimedia Italia – consentirebbe di portare grandi vantaggi, creando una possibilità concreta di collaborazione e cooperazione. I dati parziali da soli non fanno la differenza! Se però si riesce a riunire tutti questi dati allora diventa effettivamente possibile avere una fotografia precisa del mondo che ci circonda. Wikipedia è l’unico progetto non profit totalmente aperto (nel software, nel contenuto e nella modalità di lavoro) ed è uno dei dieci siti più importanti del mondo che ci circonda. Wikipedia è l’unico progetto non profit totalmente aperto (nel software, nel contenuto e nella modalità di lavoro) ed è uno dei dieci siti più importanti del mondo. Noi di MLOL cerchiamo di far capire l’importanza di poter usare in modo costruttivo i dati di cui dispongono le biblioteche. Provo a fare un esempio. Un tema caro a chiunque lavori nel mondo della cultura (bibliotecari, librai, editori, insegnanti) è la promozione della lettura. Perché non è possibile fare allora uno studio sulla correlazione tra efficienza del trasporto pubblico e utilizzo dei libri? La mia ipotesi è che questa correlazione esista: un trasporto pubblico ben organizzato promuove la lettura. Basti pensare a quante persone leggono nel tragitto casa-lavoro sui treni, le metropolitane o gli autobus. Per poter sviluppare questa analisi bisognerebbe disporre dei dati legati al territorio (dati di prestito bibliotecario, dati di vendita degli editori e delle librerie) e informazioni sul trasporto pubblico. Poter accedere a questa mole di dati oggi è praticamente impossibile».
I dati bibliotecari in Italia quindi ci sarebbero ma non è possibile raccoglierli e utilizzarli in modo strutturato. La disponibilità di questi dati innescherebbe anche un meccanismo virtuoso legato al loro utilizzo, creando concorrenza tra gli operatori. Ma cosa avviene invece negli altri Paesi? Esistono diversità piuttosto marcate soprattutto su alcuni aspetti.
«C’è una differenza abbastanza sostanziale soprattutto per quanto riguarda i record bibliografici storici, che in Italia non vengono ancora pubblicati – continua Blasi. All’estero invece questo avviene in modo sistematico. Basti pensare che chiunque può scaricare l’intero catalogo della British Library (la biblioteca centrale inglese) in diversi formati e riutilizzarlo nel modo che preferisce. Inoltre siamo uno dei pochi Paesi che ha una variante nazionale dello standard di catalogazione MARC che ci rende non automaticamente interoperabili con il resto del mondo. In alcuni Paesi europei (come la Germania e i Paesi Bassi) inoltre si sta sviluppando la tendenza a «distruggere» i dati transazionali affinché nessuna possibilità di tracciamento sia possibile. È un timore di carattere politico, legato alla possibile individuazione di trend di lettura all’interno delle biblioteche, che vuole creare una barriera preventiva contro qualunque forma di censura».
Anche negli Stati Uniti si sta assistendo a fenomeni di questo tipo, in particolare dopo l’elezione di Donald Trump alla Casa Bianca. Alcune importanti biblioteche pubbliche e private del Paese hanno dichiarato l’intenzione di «distruggere» le informazioni relative ai propri utenti prima che queste possano essere usate contro di loro e stanno pensando anche al backup dei propri dati all’estero. La New York Public Library per esempio ha recentemente cambiato la propria privacy policy, sottolineando che i dati saranno conservati il tempo minimo necessario per fornire il servizio ai propri utenti.
Il vasto tema dell’innovazione in biblioteca sarà approfondito al Convegno delle Stelline il 16 e il 17 marzo a Milano che avrà come tema La biblioteca aperta: tecniche e strategie di condivisione.
Redattore scientifico iscritto all'ordine degli ingegneri della provincia di Modena. Dopo la laurea in Ingegneria e l’esperienza di ricerca in ambito accademico svolta presso l’Università di Bologna, ho frequentato il master in editoria dell'Università Cattolica di Milano e ho lavorato diversi anni alla redazione del Giornale della libreria. Seguo il mondo editoriale nelle sue diverse sfaccettature, con particolare interesse per il confronto tra le realtà dei diversi Paesi del mondo e per le ultime novità dal punto di vista produttivo e tecnologico.
Guarda tutti gli articoli scritti da Antonio Lolli