logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Full exam

Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 201 9-20 Docente: P. Lops - 13 Aprile 20 21 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Sia q una query che ha 5 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking R q: D1 D5 D3 D7 D9 D4 Supponiamo che D1, D7 e D4 siano documenti rilevanti per q a) Fornire la descrizione sintetica delle metriche: F1 , R-Precision ed Average Precision (PUNTI 3) b) Calcolare F1 , R-Precision ed Average Precision per la query q (PUNTI 3) 2) Siano dati l’insieme dell e categorie C = {c1, c2 } e un a collezione di 100 documenti definiti sul voca bolario V = {T1,T2,T3,T4,T5 }. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni docu mento si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze: D1={T1:2, T2:3 , T4: 4} D2={T1:1, T3:2} D3={T2:2, T 3:4} D4={T 1:4, T 4:2} NB: illustrare chiaramente tutte le fasi di costruzione del cla ssificatore (PUNTI 7) b) Determinare la classe di appartenenza del seguente documento d={T 3:2,T 5:2} (PUNTI 2) 3) Descrivere in maniera sintetica i principi alla base del PageRank, focalizzando l’attenzione sul la formulazione basata su l Flow model (PUNTI 5) 4) Descr ivere l’ontologia linguistica WordNet ed indicare come è organizzata e rapp resentata la conoscenza lessicale al suo interno . (PUNTI 5) 5) Descrivere, commentando opportunamente, la funzione per il calcolo delle predizioni dei rating in un algoritmo di filtr aggio collaborativo di tipo user to user . (PUNTI 5)