logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Second partial exam

Seconda prova in itinere di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 20 13-14 Docent e: P. Lops - 8 Gennaio 20 14 (DURATA: 2 ore ) Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Siano dati l’insieme delle categorie C = {c 1, c 2} e una collezione di documenti definiti sul vocabolario V = {T1, T2, T3, T4, T5, T6>}. Costruire un classificatore bayesiano per C, addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni documento d j si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze: d1={T 1:2, T 2:3, T 4:4} d2={T 1:1, T 3:2} d3={T 2:1, T 4:2} d4={T 1:1, T 2:2, T 5:4} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore (PUNTI 7) Determinare la classe di ap partenenza del documento dx={T 6:2} (PUNTI 3) 2) Sia data la seguente matrice utenti -item di un sistema di filtraggio collaborativo, i cui rating di gradimento sono espressi in una scala discreta da 1 a 5 I1 I2 I3 I4 I5 I6 U1 1 3 4 1 4 5 U2 2 4 3 1 5 4 U3 1 5 5 3 U4 1 1 4 2 4 1 U5 4 4 1 2 4 1 a) Indicare la lista ordinata dei neighbors per l’utente attivo U3, utilizzando i seguenti valori di similarità: sim (U1, U3) =0,87 sim (U2 ,U3) =0,67 sim (U4 ,U3) =0,49 sim (U5 ,U3) = -0,40 (PUNTI 2) b) Calcolare le predizioni per gli item I5 ed I6 per l’utente attivo U3 , utilizzando un algoritmo di collaborative filteri ng di tipo user -to-user , ed utilizzando una neighborhood size pari a 2 . (PUNTI 8) 3) Illustrare in maniera sintetica i problemi dei recommender systems di tipo content -based . (PUNTI 7) 4) Descrivere le metriche di errore (MAE ed RMSE) utilizzate per la valutazione dell’accuratezza dei recommender system s (PUNTI 5)