- userLoginStatus
Welcome
Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.
Informatica - Metodi per il ritrovamento dell'informazione
Full exam
Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 20 13-14 Docent e: P. Lops 14 Gennaio 20 14 (DURATA: 2 ore ) Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Sia d ata la seguente collezione di documenti con le relative occorrenze dei termini : d1=(T2: 9, T 4:1) d2=(T1: 3, T3: 12, T4:1) d3=(T2:1, T3:4, T5:1) d4=(T2: 5, T4: 5, T6:1 ) d5=(T1: 1, T2:4, T6:3) a) Costruire l'indice invertito della collezione (PUNTI 3) b) calcolare il ranking dei documenti rispetto alla query q=(T1:1, T6:1) utilizzando la similarità del coseno e come schema di pesatura dei termini il TF -IDF (*) (*) Non applicare nessuna normalizzazione al TF, utilizzare il logaritmo in base 10. (PUNTI 5) 2) Descrivere l’ontologia linguistica WordNet ed indicare come è organizzata e rappresentata la conoscenza lessicale al suo interno. (PUNTI 8) 3) Sia q una query e s iano S1 ed S2 due sistemi che riportano i seguenti primi 10 risultati in risposta alla query q. R indica che un documento è rilevante, N indica che il documento è non rilevante (il risultato più a sinistra è il top della lista). S1: NNRN RRNNRR S2: NRN RRRRN RN Calcolare l’accuratezza dei due sistemi per la query q, utilizzando le seguenti metriche , fornendone anche una breve descrizione: a) P@5, P@10 (PUNTI 2) b) Sapendo che i documenti rilevanti nella collezione sono 6, calcolare la Average Precision e Recall @10 (PUNTI 4) 4) Descrivere , commentando opportunamente, la funzione per il calcolo delle predizioni dei rating in un algoritmo di filtraggio collaborativo di tipo user to user . (PUNTI 8)