Sull’importanza degli identificatori permanenti. Introduzione

L’editoria digitale oggi viene diffusa essenzialmente attraverso il Web.

Nell’architettura del Web, le Universal Resource Locator, più note come URL sono essenziali per individuare e localizzare risorse di ogni genere, come articoli pubblicati da riviste scientifiche, le riviste stesse, dataset, ma anche ricercatori, organizzazioni etc.

Pregi e difetti delle URL

Le URL svolgono bene il loro compito (tanto è vero che continuiamo a utilizzarle), ma hanno tre principali limitazioni:

  1. la medesima risorsa può essere localizzata da URL diverse;
  2. alcune URL possono essere lunghe e difficili da ricordare
  3. le URL potrebbero cambiare e i collegamenti fatti attraverso di queste rompersi (i famigerati errori 404) rendendo difficile, se non impossibile, il reperimento della risorsa.

La prima questione ha delle ricadute in ogni ambito, non solo nelle risorse di ambito accademico, tanto è vero che una delle possibili soluzioni (la definizione delle URL cosiddette “canonical” è nata nell’ambito dei motori di ricerca ed è targata Google, che alle risorse duplicate fa una piccola guerra.

Anche il secondo punto può diventare un problema, se non stiamo attenti a creare e gestire delle URL con una strutturazione logica e leggibile. In caso contrario le URL possono diventare lunghe e incomprensibili, per esempio quando contengono parametri di query e simili. Questo è il motivo per cui nel web (in particolare nei social network) si sono enormemente diffusi servizi per accorciare le URL, come il notissimo goo.gl (indovinate di chi è…) e molti altri.

La terza questione è particolarmente importante. Ci sono diverse soluzioni tecniche a questo problema, per esempio si può mantenere una “landing page” per ciascuna risorsa che non cambi mai, utilizzando dei redirect server per aggiornare la localizzazione della risorsa stessa. Questa pratica è efficace per gestire cambi di URL all’interno di uno stesso server, ma molto più complicata se cambia anche il nome del server che ospita la landing page.
Pensandola su scala più ampia, la soluzione (che poi è quella praticata da servizi di permanent identification come DOI e handle) è quella di gestire un servizio centralizzato che fornisca sia l’infrastruttura tecnologica per garantire centralmente la gestione dei redirect, sia anche una serie di regole che chi vuole utilizzare il servizio è obbligato a seguire, a differenza dei servizi di accorciamento delle URL ai quali ho accennato.

photo 'Persistence' in the dictionary
‘Persistence” in the dictionary, by uberof202 ff

Approfondimenti sugli identificatori permanenti