Il tuo browser non supporta JavaScript!
Editori

Metadati. Come usarli e perché

di Gregorio Pellegrino e Monica Pairone notizia del 4 febbraio 2020

Attenzione, controllare i dati.

Sono lo strumento fondamentale per portare i libri nelle librerie fisiche e online. Per l’editore si collocano in cima alla lista degli asset su cui investire per avere un catalogo sempre più dettagliato, per conseguire  una maggiore visibilità e ricercabilità delle proprie opere. E di conseguenza per aumentare le vendite. I metadati sono in circolazione da molto tempo: basti pensare che il primo catalogo della Fiera del libro di Francoforte risale al 1564 (La Bibliofilia, Firenze, Casa Editrice Leo S. Olschki 1988, p.89).

Negli anni, sempre più biblioteche hanno affinato la tecnica della classificazione dei testi, creando collezioni di schede bibliografiche che indicizzavano i dati più funzionali ai lettori e ricercatori: autore, titolo, editore, data di pubblicazione, classificazione... A questi primi metadati puramente bibliografici si sono aggiunte altre tipologie: i metadati commerciali (codice ISBN, prezzi, fornitori, disponibilità) e quelli relativi al marketing (testi di presentazione del contenuto, immagini di copertina).

In Italia IE-Informazioni Editoriali è leader nella gestione dei metadati editoriali: dal 1985 pubblica il Catalogo dei libri in commercio (prima in cartaceo, poi su cd-rom, infine online). IE si occupa di organizzare tutte le informazioni presenti nella filiera editoriale sui titoli in commercio in un unico database uniforme, eseguendo un lavoro di controllo e catalogazione sui dati, offrendo così alle librerie online e fisiche e agli altri operatori di filiera (biblioteche, grossisti, motori di ricerca) dati precisi provenienti da un’unica fonte.

L’IMPORTANZA DEGLI STANDARD
Uno dei grossi limiti della filiera editoriale italiana (e non solo) è la frammentarietà, se poi si pensa al mercato globale il problema diventa esponenziale. Nell’ambito della metadatazione esistono principalmente due famiglie di standard: gli standard relativi alle biblioteche e quelli relativi alla filiera del commercio editoriale. I primi sono focalizzati a descrivere il contenuto del testo, le persone che lo hanno redatto e così via; i secondi aggiungono informazioni riguardanti la commercializzazione del libro (prezzo, fornitori, disponibilità).

Nell’ambito degli standard per i metadati della filiera editoriale il più affermato in Italia e nel mondo è ONIX for Books. ONIX è l’acronimo di ONline Information EXchange: un formato standard per scambiare informazioni digitali sui libri lungo tutta la filiera editoriale. È manutenuto da EditEUR – un ente internazionale che sviluppa standard per l’editoria – che ha membri in tutto il mondo (per l’Italia: l’Associazione Italiana Editori, Casalini Libri e Informazioni Editoriali).

La versione 3 (la più recente) è stata pubblicata nel 2009 e ogni anno viene aggiornata, con release periodiche. Un aspetto importante di ONIX è che si tratta di un formato aperto, le cui specifiche sono pubblicate online, e che può essere utilizzato da chiunque, senza necessità di sottoscrivere licenze. Un aspetto importante per un editore che struttura i propri metadati in vista della distribuzione con standard ONIX è quello di metter ordine alle informazioni bibliografiche.

È l’esperienza che abbiamo fatto in Effatà Editrice [una piccola casa editrice «di famiglia» che pubblica libri di saggistica religiosa, con sede in provincia di Torino, di cui Gregorio Pellegrino e Monica Pairone rappresentano la seconda generazione] dove nel 2013 abbiamo iniziato a utilizzare il software ONIXsuite per la gestione del catalogo.

Dopo lo sforzo iniziale di mettere ordine, raccogliere e uniformare i dati che erano sparsi su più sistemi differenti (gestionale, archivio delle copertine, sito web) ci siamo ritrovati con un archivio delle nostre pubblicazioni finalmente ben strutturato. Questo ha avuto una ricaduta considerevole in termini di efficienza: ad esempio dal 2014 pubblichiamo tre volte l’anno il catalogo delle novità unendo la grafica fatta in InDesign con i dati in ONIX, riducendo i tempi di lavorazione da oltre una settimana a uno o due giorni lavorativi, ma soprattutto minimizzando gli errori.

Il fatto di avere dati strutturati in maniera uniforme ci ha permesso inoltre di aggiornare il sito web automaticamente e di affiancare altri e-commerce realizzati su temi verticali (per autori, collane, progetti) con uno sforzo di setup minimo e con un costo di mantenimento pressoché nullo.



COME DISTRIBUIRE I METADATI
Seppur strutturare e arricchire i metadati generi benefici per l’organizzazione aziendale, i maggiori risultati si ottengono distribuendo i metadati in formato standard lungo la filiera editoriale. Fortunatamente in Italia la distribuzione è semplificata dal lavoro di Informazioni Editoriali che fa da collettore e distributore dei metadati.

I metadati in formato ONIX 3 – dopo una prima attenta valutazione da parte di IE – possono essere inviati automaticamente (quotidianamente) alla banca dati CALIPSO che raccoglie il catalogo dei libri, degli e-book e dei prodotti non librari venduti in libreria. Informazioni Editoriali – che gestisce CALIPSO – si occupa di unire le informazioni ricevute dall’editore con quelle che arrivano dagli altri operatori della filiera (ad esempio la disponibilità a magazzino del distributore) e di aggiungere o correggere i dati catalografici.

La banca dati derivante da CALIPSO viene quindi distribuita (secondo varie modalità e formati) agli operatori della filiera abbonati al servizio di Informazioni Editoriali: librerie fisiche, librerie online, biblioteche, grossisti, motori di ricerca e social network e istituti di ricerca di mercato. Questo sistema automatizzato permette non soltanto di inviare le informazioni nel momento in cui il libro viene pubblicato, ma anche di poter correggere e mantenere i dati aggiornati lungo tutta la vita della pubblicazione (ad esempio riportare nella descrizione l’assegnazione di un premio letterario).

MIGLIORARE I METADATI PER VENDERE PIÙ LIBRI
Al giorno d’oggi i metadati sono quanto mai fondamentali per tutti gli acquisti che vengono fatti online: il lettore che acquista tramite e-commerce non ha la possibilità di sfogliare fisicamente il libro e quindi tutte le informazioni della fase di preacquisto dipendono interamente dai metadati (numero di pagine, formato, contenuto e via dicendo).

Anche nelle librerie fisiche i metadati sono importanti, soprattutto quando il titolo non è disponibile a scaffale e il libraio deve trovarlo tra gli oltre 1,2 milioni di libri in commercio, magari trovandosi ad avere nel momento della necessità solo informazioni parziali o non del tutto precise.

Di conseguenza per gli editori migliorare i propri metadati, arricchirli, correggerli, significa aumentare e migliorare la discoverability delle proprie pubblicazioni e quindi vendere di più. Questa correlazione è stata anche dimostrata da due studi realizzati recentemente.

Nel 2017 la Stanford University Press si è affidata a una società di consulenza del Regno Unito per trovare una soluzione automatica per migliorare i propri metadati bibliografici. Affidandosi ad algoritmi di machine learning, linguistica computazionale e alla teoria dei grafi (tecniche di approccio matematico-informatico) sono riusciti ad estrarre metadati arricchiti partendo dai file PDF delle pubblicazioni. Questa soluzione tecnologica ha permesso di aggiungere tre categorizzazioni e undici parole chiave per ogni titolo. Il risultato? Un +10% nelle vendite.

Nel 2016 Nielsen Uk (che gestisce il catalogo dei libri in commercio nel Regno Unito) ha eseguito un’analisi che metteva in relazione i record presenti nel proprio database – ovvero tutti i titoli in commercio in Uk – e i risultati di vendita degli stessi titoli. È emerso che gli editori che erano soliti arricchire maggiormente i metadati avevano avuto mediamente un +13% nelle vendite rispetto ai propri pari.

Nielsen, in occasione di un’ulteriore analisi sul medesimo tema, dichiarava: «Rivedere il nostro studio precedente ha dimostrato che le nostre scoperte originali sono ancora valide: i titoli con metadati completi, appropriati e descrittivi vendono più copie, in media, dei titoli con metadati meno completi. […] Non possiamo misurare la causa diretta, ma solo identificare la correlazione tra la presenza di metadati e le vendite. Tuttavia, poiché vediamo questa correlazione quando analizziamo metadati diversi e pur segmentando i dati in diversi modi, riteniamo che esistano chiari indicatori per il collegamento tra metadati e vendite».

Questo contenuto è la versione rivista di un articolo pubblicato sul «Giornale della libreria» di gennaio. Se sei abbonato, consulta qui la tua copia. Altrimenti scopri come abbonarti a questo link.

L'autore: Gregorio Pellegrino e Monica Pairone

Siamo la seconda generazione di Effatà Editrice. Gregorio ha studiato ingegneria informatica e ha una forte passione per tutte le soluzioni tecnologiche che favoriscono la vita quotidiana. Monica, dopo una laurea in filosofia, ha completato gli studi in sistemi informativi aziendali.

Guarda tutti gli articoli scritti da Gregorio Pellegrino e Monica Pairone

Inserire il codice per il download.

Inserire il codice per attivare il servizio.