logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Full exam

Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 201 9-20 Docente: P. Lops - 31 Gennaio 20 20 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Sia q una query che ha 6 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking R q: D1 D5 D3 D7 D9 D4 Supponiamo che D5, D7 e D4 siano documenti rilevanti per q a) Calcolare l’Average Prec isi on per la query q, fornendo anche una descrizione dell a metric a (PUNTI 3) b) Riportare la curva di precision -recall per la query q, usando gli 11 livelli standard di recall (PUNTI 3 ) c) Supponendo di avere dei giudizi di rilevanza non binari, e assume ndo che D5 abbia un grado di rilevanza pari a 3, mentre D7 e D4 abbiano un grado di rilevanza pari a 1, calcolare il valore del DCG (Discounted Cumulative Gain) per q, fornendo anche una breve descrizione della metrica. (PUNTI 4) 2) Siano dati l’insieme dell e categorie C = {c1, c2 } e un a collezione di 150 documenti definiti sul vocabolario V = {T1,T2,T3,T4,T5 }. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze: D1={T1:2, T2:3 , T4: 4} D2={T1:1, T3:2} D3={T2:2, T 3:4} D4={T 1:4, T 4:2} NB: illustrare chiaramente tutte le fasi di costruzione del cla ssificatore (PUNTI 6 ) b) Determinare la classe di appartenenza del seguente documento d={T 3:2,T 5:2} (PUNTI 2) 3) Descrivere in maniera sintetica i principi alla base del PageRank, focalizzando l’attenzione sul la formulazione basata su l Flow model (PUNTI 4) 4) Descrivere l’ontologia linguistica WordNet ed indicare come è organizzata e rappresentata la conoscenza lessicale al suo interno . (PUNTI 4) 5) Descrivere, commentando opportunamente, la funzione per il calcolo delle predizioni dei rating in un algoritmo di filtraggio collaborativo di tipo user to user . (PUNTI 4)