Misurare la complessità delle query in un discovery tool

Ho letto un articolo interessante, qualche giorno fa nel numero di agosto della bella rassegna periodica di Roy Tennant intitolata “Current Cites“. Si tratta di 

Cohen, R., & Pusnik, A. (2018). Measuring Query Complexity in Web-Scale Discovery: A Comparison between Two Academic Libraries.Reference & User Services Quarterly, 57(4), 274-284. doi:http://dx.doi.org/10.5860/rusq.57.4.6705

L’articolo riferisce i risultati di un’analisi condotta dagli autori attraverso i logo delle transazioni di ricerca degli utenti dei discovery tool di due campus dell’Università dell’Indiana.

L’analisi dei log delle ricerche è uno strumento utile, anche perché non invasivo, per valutare l’uso che gli utenti fanno degli strumenti messi a loro disposizione. L’articolo riporta una breve rassegna degli studi più significativi in quest’ambito nel settore biblioteconomico.

L’analisi dei log delle ricerche è uno strumento utile per i bibliotecari.

Attraverso un’analisi del genere, i bibliotecari possono avere percezione, da una parte, delle parole chiave maggiormente ricercate, e dall’altra dell’uso che gli utenti fanno davvero degli strumenti di ricerca. Due studi citati hanno misurato rispettivamente, per esempio, una diminuzione delle consultazioni dell’OPAC in due istituzioni diverse, al momento dell’acquisizione di un discovery tool. [ref]Si tratta di Jan Kemp, “Does Web-Scale Discovery Make a Difference? Changes in Collection Use after Implementing Summon,” in Planning and Implementing Resource Discovery Tools in Academic Libraries, edited by Mary Pagliero Popp and Diane Dallis, (Hershey, PA: Information Science Reference, 2012), 456–68, https://doi.org/ 10.4018/978-1-4666-1821-3.ch026 e di Kristin Calvert, “Maximizing Academic Library Collections: Measuring Changes in Use Patterns Owing to EBSCO Discovery Service,” College & Research Libraries 76, no. 1 (2015): 81–99, https://doi.org/10.5860/crl.76.1.81.[/ref]

Gli autori hanno analizzato i log di ricerche -circa 18.000- effettuate nel secondo semestre 2015 dagli utenti EDS delle due università campione (che hanno EBSCO Discovery Service dal 2011). I log sono stati ottenuti attraverso l’integrazione di EDS e Google Analytics.

Le query sono state normalizzate e ridotte a 1.677, in maniera tale che entrambi i campus avessero lo stesso numero di query nonostante la differente grandezza delle due istituzioni; ciascuna query è stata poi classificata secondo lo schema della LoC.

Inoltre le query sono state distinte tra “Ricerca base” e “Ricerca avanzata” e sono stati individuati i codici dei campi eventualmente utilizzati per la ricerca avanzata stessa. Nelle opzioni della ricerca avanzata, infatti, EDS propone questi campi: 

  • TX – All Text
  • AU – Author
  • TI – Title
  • SU – Subject Terms
  • SO – Source
  • AB – Abstract
  • IS – ISSN
  • IB – ISBN

Gli autori hanno anche identificato query frequenti per identificare potenziali modelli di query di ricerca. Gli argomenti con più di dieci query  sono stati raggruppati come “query popolari”. Questi raggruppamenti riflettono non solo ricerche ripetute sulla stessa query o simili, ma anche ricerche frequenti su libri scritti da determinati autori, o query tematiche, come i miti.

Complessità delle query

Per impostazione predefinita, sia IUB che IUK indirizzano gli utenti all’opzione Ricerca di base in EDS; pertanto, i dati di utilizzo per le opzioni di ricerca avanzata riflettono una scelta misurata dagli utenti: hanno intrapreso un’azione specifica per eseguire una ricerca avanzata, anziché affidarsi alla ricerca di base. La Figura sotto mostra la suddivisione delle ricerche Base, Avanzata e Avanzata  + codici di campo in entrambi i campus.

Basic vs. Advanced vs. Advanced + field code searches breakdown

Gli utenti IUB hanno eseguito quasi 3 volte più ricerche avanzate degli utenti IUK e circa 2,5 volte più ricerche avanzate con codici di campo. Sebbene le query che utilizzano i codici di campo vengano automaticamente considerate Ricerche avanzate, poiché gli utenti devono essere nella schermata Ricerca avanzata per visualizzare il menu a discesa dei codici di campo, la maggior parte delle Ricerche avanzate in entrambi i campus non include alcun codice di campo.

Ricerche di item noti

In entrambi i campus, gli utenti hanno cercato titoli, articoli e autori noti senza utilizzare codici di campo. I titoli degli articoli sono stati cercati 77 volte (4,6%) a IUB e 136 volte (8,1%) a IUK. I titoli noti sono stati cercati meno, con 22 ricerche di questo tipo (1,3%) registrate a IUB e 65 (3,9%) a IUK. Le ricerche dell’autore senza il codice di campo AU si sono verificate meno spesso: 13 utenti (0,8%) hanno cercato autori presso IUB e solo 3 (0,2%) hanno cercato su IUK. 

Gli autori discutono sul modo in cui hanno raccolto le query di ricerca dai registri delle transazioni, hanno classificato le query in base al piano di classificazione della Biblioteca del Congresso e quindi hanno esaminato le query utilizzando strumenti di analisi del testo per identificare quali soggetti venivano cercati e se gli utenti utilizzavano opzioni di ricerca avanzate. I risultati di questa indagine dimostrano come i log delle transazioni possono essere utilizzati per comunicare le interazioni dell’utente all’interno dei servizi di scoperta. I risultati offrono una visione dettagliata delle materie e delle abilità che docenti e bibliotecari dovrebbero comunicare per migliorare le informazioni sull’alfabetizzazione. Le query di ricerca rivelano anche esigenze di informazione che forniscono indicazioni per i gestori di raccolta.

Disclaimer: per chi non lo sapesse lavoro per EBSCO Information Services e mi occupo proprio di EDS.