- userLoginStatus
Welcome
Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.
Informatica - Metodi per il ritrovamento dell'informazione
Full exam
Prova scritta di METODI PER LA GESTIONE DELL A CONOSCENZA C.d.L. in Informatica e Tecn. per la Prod. del Software - A.A. 20 16-17 Docent e: P. Lops - 16 Gennaio 20 17 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Siano dati l’insieme delle categorie C = { c1 ,c2 } e un a collezione di 50 documenti definiti sul vocabolario V = {T 1, T 2, T 3, T 4, T 5, T 6}. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze: D1={T1:2, T2:3 , T4: 4} D2={T1:1, T3:2} D3={T2:1, T4:2} D4={T2:2, T5:4} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore (PUNTI 5) b) Determinare la classe di appartenenza del seguente documento d={T 1:2,T6: 2} (PUNTI 2) 2) Sia q una query che ha 5 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking Rq: D 3 D1 D5 D7 D9 Supponiamo che D1 e D9 siano documenti rilevanti per q a) Calcolare F1, R -precision ed Average Precision per q, fornendo anche una descrizione formale delle metriche (PUNTI 4) b) Supponendo di avere dei giudizi di rilevanza non binari, e assumendo che D1 e D9 abbiano un grado di rilevanza pari a 3, mentre D7 abbia un grado di rilevanza pari a 2, calcolare il valore del DCG (Discounted Cumulative Gain) per q, fornendo anche una breve descrizione della metrica. (PUNTI 4) 3) Sia data la seguente matrice utenti -item di un sistema di filtraggio collaborativo, i cui rating di gradimento sono espressi in una scala discreta da 1 a 5 I1 I2 I3 I4 U1 2 4 1 1 U2 5 2 4 U3 3 5 ? U4 4 4 1 Calcolare la predizione per l’item I4 per l’utente attivo U3, utilizzando un algoritmo di collaborative filtering di tipo item -to-item , ed utilizzando una neighborhood size pari a 2. (PUNTI 5) 4) Descrivere in maniera sintetica i principi alla base del PageRank, focalizzando l’attenzione sulla formulazione ricorsiva basata sul “flow” model. (PUNTI 10 )