logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Full exam

Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 2018 -19 METODI PER LA GESTIONE DELLA CONSOCENZA C.d.L. in Informatica e Tecn. Per la Prod. del Software – A.A. 2016 -17 Docente: P. Lops - 24 Settembre 2019 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Descrivere, commentando opportunamente, la funzione per il calcolo delle predizioni dei rating in un algoritmo di filtraggio collaborativo di tipo user to user . (PUNTI 10) 2) Siano dati l’insieme delle categorie C={ c1 ,c2 } e una collezione di 10 0 documenti definiti sul vocabolario V = {T1, T2, T3, T4, T5, T6}. Costruire un classificatore bayesiano per C, addestrandolo sul seguente training set TR: TR = {, , , , } dove per ogni documento si riporta di seguito l’elenco delle parole con le relative occorrenze: T1 T2 T3 T4 T5 T6 D1 4 3 0 4 0 0 D2 1 0 2 0 0 0 D3 0 1 2 2 0 0 D4 0 2 0 0 4 0 D5 1 1 4 1 2 0 NB: illustrare chiaramente tutte le fasi di costruzione del classificatore . (PUNTI 8) Determinare la classe di appartenenza del seguente documento d={T 1:2,T 6:2} (PUNTI 2) 3) Sia q una query che ha 5 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking Rq: D1 D5 D3 D7 D9 D4 Supponiamo che D1 , D7 e D9 siano documenti rilevanti per q a) Calcolare Precision ed Average Precision per q, fornendo anche una descrizione formale delle metriche (PUNTI 4) b) Supponendo di avere dei giudizi di rilevanza non binari, e assumendo che D1 e D9 abbiano un grado di rilevanza pari a 3, mentre D7 abbia un grado di rilevanza pari a 2, calcolare il valore dell’ nDCG (normalized Discounted Cumulative Gain) per q, fornendo anche una breve descrizione della metrica. (PUNTI 6)