logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Full exam

Prova scritta di METODI PER LA GESTIONE DELL A CONOSCENZA C.d.L. in Informatica e Tecn. per la Prod. del Software - A.A. 20 16-17 Docent e: P. Lops - 4 Luglio 20 18 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Siano dati l’insieme delle categorie C = { c1 ,c2 } e un a collezione di 150 documenti definiti sul vocabolario V = {T 1, T 2, T 3, T 4, T 5, T 6}. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze: D1={T1:2, T2:3} D2={T1:1, T3: 4} D3={T 3:2, T 6:2} D4={T 4:2, T 6:3} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore (PUNTI 6) b) Determinare la classe di appartenenza del seguente documento d={T 1:2,T 5:2} (PUNTI 2) 2) Sia q una query che ha 8 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking Rq: D 3 D1 D5 D7 D9 Supponiamo che D1 e D7 siano documenti rilevanti per q. Calcolare Precision , Recall , F1 , R-precision ed Average Precision per q, fornendo anche una descrizione formale delle metriche (PUNTI 8) 3) Illustrare in maniera sintetica i seguenti problemi: a) Overspecialization nei recommender systems di tipo content -based (PUNTI 4) b) Cold -start nei recommender systems di tipo collaborativo (PUNTI 4) 4) Descrivere il processo di modifica delle query basato sul metodo del relevance feedback . (PUNTI 6 )