- userLoginStatus
Welcome
Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.
Informatica - Metodi per il ritrovamento dell'informazione
Full exam
Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 2018 -19 Docente: P. Lops - 22 Febbraio 2019 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Descrivere l’ontologia linguistica WordNet ed indicare come è organizzata e rappresentata la conoscenza lessicale al suo interno. (PUNTI 5) 2) Data una collezione di documenti e le relative occorrenze dei termini: d1=(T 1:7 , T 2:5, T5:1) d2=(T1: 4, T5:3 ) d3=(T 1:2, T3: 2, T 4:1) d4=(T 3:2 ) a) Costruire l ’indice invertito della collezione (PUNTI 2) b) calcolare il ranking dei documenti rispetto alla query q= (T1:1 AND T5 :2 ) utilizzando la similarità del prodotto interno e utilizzando le occorrenze dei termini per la rappresentazione dei documenti . (PUNTI 4) 3) Siano q1 e q2 due query distinte che hanno rispettivamente 6 e 3 documenti rilevanti nella collezione. Supponiamo che lo stesso algoritmo di ritrovamento applicato alle due query distinte riporti i seguenti ranking R q1 ed R q2 (X indica che un documento è rilevante; 0 indica che il documento è non rilevante; il risultato più a sinistra è il top della lista): Rq1: X0X X00000X Rq2: 0XX00 0X000 a) Fornire la descrizione delle seguenti metriche: P@K, R -precision, Average Precision (PUNTI 3) b) Calcolare P@3, R -precision e Average Precision per le query q1 e q2 (PUNTI 3) c) Riportare la curva di precision -recall per la query q1, usando gli 11 livelli standard di recall (PUNTI 3 ) 4) Descrivere, commentando opportunamente, la funzione per il calcolo delle predizioni dei rating in un algoritmo di filtraggio collaborativo di tipo user to user . (PUNTI 5 ) 5) Descrivere in maniera sintetica i principi alla base del PageRank, focalizzando l’attenzione sulla formulazione ricorsiva basata sul “flow” model. (PUNTI 6)