logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Full exam

Prova scritta di METODI PER LA GESTIONE DELL A CONOSCENZA (CdL ITPS) A.A. 20 16-17 - Docent e: P. Lops Prova scritta di METODI PER IL RITROVAMENTO DELL’INF . (CdL Informatica) A.A. 2016 -17 - Docente: P. Basile 17 Aprile 20 18 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Siano dati l’insieme delle categorie C = { c1 ,c2 } e un a collezione di 10 0 documenti definiti sul vocabolario V = {T 1, T 2, T 3, T 4, T 5, T 6}. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze: D1={T1:2, T2:3 , T4: 4} D2={T1:1, T3:2} D3={T2:1, T4:2} D4={T2:2, T5:4} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore (PUNTI 6) b) Determinare la classe di appartenenza del seguente documento d={T 1:2,T6: 1} (PUNTI 2) 2) Sia q una query che ha 4 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking Rq: D 3 D1 D5 D7 D9 Supponiamo che D1 e D7 siano documenti rilevanti per q Calcolare F1, R -precision ed Average Precision per q, fornendo anche una descrizione formale delle metriche (PUNTI 7) 3) Descrivere in maniera sintetica i principi problemi dei content -based recommender systems . (PUNTI 7) 4) Descrivere il processo di modifica delle query basato sul metodo del relevance feedback . (PUNTI 8)