Google Scholar è il maggiore indice di articoli scientifici liberamente ricercabile. Contiene diversi milioni di articoli, di ogni ambito disciplinare.
Se sei un ricercatore (o un bibliotecario) avrai certamente già utilizzato Google Scholar, il servizio di Google dedicato all’indicizzazione dei prodotti della ricerca, per trovare articoli di rivista sui temi che ti interessano.
Se sei editor di una rivista, invece, ti interesserà sicuramente sapere come proporre i tuoi contenuti al motore di ricerca per fare in modo che siano indicizzati correttamente.
Vediamolo in pochi passaggi.
1. Verifica di pubblicare contenuti adatti a Google Scholar
Scholarly articles
Google Scholar indicizza articoli scientifici, pubblicati in riviste o presentati a convegni e rapporti tecnici (anche come pre-print o post-print), tesi o anche solo abstract. Contenuti quali news articoli di riviste non scientifiche, recensioni di libri e articoli di opinione non vengono accettati. Documenti più grandi di 5MB, come libri o tesi molto ampie, vanno caricati in Google Book Search; Google Scholar selezionerà e includerà automaticamente i contenuti scientifici da Google Book Search.
Abstract accessibili
Per fare in modo che i potenziali lettori arrivino ai tuoi articoli, devi fare in modo che il sito della rivista metta a disposizione liberamente i full text o almeno gli abstract.
Devi costruire il sito in maniera tale che ogni articolo (o almeno i suoi metadati) siano accessibili a una URL specifica, che possa essere indicizzata autonomamente nel motore.
Il sito non deve costringere gli utenti (né le persone, né i robot dei motori di ricerca!) alla registrazione per la visualizzazione degli abstract e questi devono essere ben visibili non appena si apre la pagina. Siti che presentano pagine di login, pagine di errori, o anche solo dati bibliografici privi di abstract non verranno considerati per l’inclusione.
2. Metti Google in grado di raccogliere i dati
Google Scholar utilizza software automatici, detti “robot” o “crawler”, per raccogliere i file, in maniera analoga a come si comporta il motore di ricerca Google generale.
Il tuo sito web deve essere strutturato in maniera tale da agevolare la raccolta dei dati di tutti gli articoli e l’aggiornamento periodico dell’indice di Google, per riflettere i cambiamenti.
Formato dei file
I file degli articoli devono essere in HTML o in PDF ricercabile. Vuol dire che devi essere in grado di cercare e trovare parole nel documento utilizzando, per esempio, Acrobat Reader.
Navigazione dei contenuti
I robot di Google Scholar navigano il sito della tua rivista come se fossero persone, seguendo i link. Devi fare in modo, quindi, che ogni articolo sia disponibile a una sua URL e che questa pagina sia facilmente raggiungibile dalla home page, in pochi link.
Ogni articolo deve trovarsi su una pagina dedicata, raggiungibile dalla home in pochi click, 4-5 al massimo.
Per esempio home > archivio > 2015 > fascicolo 1 > articolo di andrea
Se la tua rivista ha già pubblicato molte migliaia di articoli, potrebbe essere utile avere una pagina con i contenuti più recenti: questa verrà visitata più spesso dal motore e renderà più rapido l’aggiornamento.
Ricorda anche che l’uso di Flash, JavaScript o di una navigazione esclusivamente basata su form rende molto difficile la ricerca degli articoli da parte di un agente automatico. Se sul tuo sito fossero in uso meccanismi di questo genere, potresti costruire una semplice interfaccia di navigazione (per date, per autore o titolo) che usa solamente link HTML e indicare quella ai motori.
Protocollo di esclusione per i robot
Come probabilmente sai, Google penalizza i contenuti duplicati. Per questo è bene, tra i vari stratagemmi, dare al robot indicazioni sulle parti del sito che non deve indicizzare, perché riservate o perché contengono contenuti di servizio o duplicati.
Il modo migliore per farlo è quello di realizzare un file robots.txt che indichi ai motori i limiti del sito entro i quali muoversi.
Una volta creato il file, dovrai porlo nella directory principale del sito, in modo che sia raggiungibile a un indirizzo come http://www.ilmiosito.com/robots.txt
3. Segui scrupolosamente queste Linee guida per l’indicizzazione
URL degli articoli
Ciascun abstract/articolo, deve avere una pagina/URL separata e dedicata. Google non è ancora in grado di distinguere e indicizzare più di un abstract a partire da un unico file, né di riunire differenti parti di un paper pubblicate in file separati: quindi, un articolo, una pagina.
Meta-tag
Le pagine web che contengono gli articoli devono contenere i metadati in forma di “<meta>” tag HTML.
Google Scholar riconosce i tag Highwire Press (es. citation_title), Eprints (es. eprints.title), BE Press (e.s bepress_citation_title) e PRISM (es. prism.title). Se usi un software specifico, probabilmente questi meta tag sono già disponibili; controlla se ci sono visualizzando il codice di una pagina HTML del sito.
Il tag del titolo (es. citation_title) è obbligatorio e deve contenere il titolo dell’articolo, non quello della rivista in cui è pubblicato.
Il tag degli autori (es. citation_author) deve contenere il nome dell’autore, o degli autori, dell’articolo. L’indicazione di almeno un autore è obbligatoria. Questo elemento non deve contenere altri nomi che quello dell’autore della pubblicazione; per esempio, non deve contenere il nome del gestore del sito. I nomi degli autori possono essere indicati in forma diretta (“Andrea Marchitelli”) o inversa (Marchitelli, Andrea). In caso di più autori, ripeti il tag per ciascuno di essi.
La data di pubblicazione (es. citation_publication_date) deve contenere la data di pubblicazione. Si può indicare il giorno, in formato standard “2010-05-12” o anche solamente l’anno. Questo tag è obbligatorio per l’inclusione in Google Scholar.
Per le riviste, ulteriori metadati possono essere mostrati in questi campi:
- citation_journal_title per il titolo della rivista,
- citation_issn e citation_isbn, per ISSN e, se c’è, per l’ISBN,
- citation_volume, citation_issue, per volume e fascicolo,
- citation_firstpage, and citation_lastpage per indicare la prima e l’ultima pagina dell’articolo.
In questo caso questi metadati sono facoltativi.
Si tratta, in ogni modo, di indicare tutti i vari elementi che potrebbero comparire nella citazione bibliografica dell’articolo, che qui vanno separati nei vari tag. Ricorda che, qualsiasi schema di metadati tu scelga, devi indicare almeno 3 elementi:
- titolo dell’articolo
- nome completo degli autori, o almeno del primo autore,
- anno di pubblicazione.
I “<meta>” si riferiscono generalmente solo alla pagina in cui si trovano. Se si tratta della pagina dell’abstract e il file PDF con il full text è in un’altra posizione, puoi specificare la URL del file utilizzando il tag citation_pdf_url.
Contrassegnare la bibliografia
Ricordati (ma probabilmente, come buon editor, lo sai già) di separare la sezione di ogni paper contenente la bibliografia con una sua intestazione specifica (“References” o “Bibliography”). Le citazioni dovrebbero essere numerate e redatte utilizzando uno tra i più diffusi standard citazionali.
e se volessi ottenere il massimo?
Ricorda che il modo migliore per assolvere a tutti questi i requisiti tecnici, comunque, è quello di utilizzare un software specifico per la pubblicazione di riviste web, come OJS.
Le informazioni contenute in questo articolo sono tratte dalle Linee Guida di Google Scholar per i webmaster.