logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Full exam

Prova scritta di METODI PER LA GESTIONE DELL A CONOSCENZA C.d.L. in Informatica e Tecn. per la Prod. del Software - A.A. 20 16-17 Docent e: P. Lops - 19 Settembre 20 18 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Descrivere il processo di modifica delle query basato sul metodo del relevance feedback (algoritmo di Rocchio). (PUNTI 7 ) 2) Sia data la seguente matrice termini -documenti contenente pesi TF -IDF non normalizzati: T1 T2 T3 T4 T5 T6 D1 1 2 0 2 0 0 D2 0 3 4 0 0 0 D3 0 0 0 1 1 1 D4 1 1 1 0 2 3 D5 0 0 2 2 1 0 e la query q=(t1: 2, t2:2 , t4:1 ) a) Calcolare il ranking dei documenti rispetto alla query q utilizzando la similarità del coseno . (PUNTI 5) b) Assumendo che il quarto documento del ranking sia rilevant e e che il primo documento del ranking non sia invece rilevante, riformulare la query utilizzando l’algoritmo di Rocchio e ricalcolare il ranking dei documenti. (PUNTI 8) 3) Siano dati l’insieme delle categorie C={ c1 ,c2 } e una collezione di 60 documenti definiti sul vocabolario V = {T1, T2, T3, T4, T5, T6}. Costruire un classificatore bayesiano per C, addestrandolo sul seguente training set TR: TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole con le relative occorrenze: T1 T2 T3 T4 T5 T6 D1 2 3 0 4 0 0 D2 1 0 2 0 0 0 D3 0 1 0 2 0 0 D4 0 2 0 0 4 0 e determinare la classe di appartenenza del seguente documento d={T 1:2,T6: 2} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore . (PUNTI 10)