- userLoginStatus
Welcome
Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.
Informatica - Metodi per il ritrovamento dell'informazione
Full exam
Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 201 9-20 Docente: P. Lops - 20 Febbr aio 20 20 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Sia q una query che ha 6 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking R q: D1 D 2 D3 D 4 D5 D6 Supponiamo che D2, D4 e D6 siano documenti rilevanti per q a) Calcolare l’Average Pre cisi on , e il Recall per la query q, fornendo anche una descrizione dell e metric he (PUNTI 4) b) Riportare la curva di precision -recall per la query q, usando gli 11 livelli standard di recall (PUNTI 3 ) 2) Siano dati l’insieme dell e categorie C = {c1, c2 } e un a collezione di 100 0 documenti definiti sul vocabolario V = {T1,T2,T3,T4,T5 }. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni do cu mento si riporta di seg uito l’elenco delle parole in esso presenti, con le relative occorrenze: D1={T1: 1, T2: 2, T 3:3} D2={T 4:1 } D3={T 1:2, T 2:5} D4={T 3:4, T 4:2} NB: illustrare chiaramente tutte le fasi di costruzione del cla ssificatore (PUNTI 6 ) b) Dete rminare la classe di appa rtenenza del seguente documento d={T 2:2,T 5:2} (PUNTI 2) 3) Descrivere in maniera sintetica i principi alla base del PageRank, focalizzando l’attenzione sul la formulazione basata su lle matrici di adiacenza stocastiche . (PUNTI 5) 4) Illustrar e in maniera sintetica i seguenti problemi: a. Overspecialization nei recommender systems di tipo content -based (PUNTI 3) b. Grey sheep nei recommender systems di tipo collaborativo (PUNTI 3) 5) Descrivere in maniera sintetica i concetti fondamentali alla base del modello dei dati RDF, in particolare i concetti di risorsa , proprietà e statement . (PUNTI 4)