logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Informatica - Metodi per il ritrovamento dell'informazione

Full exam

Prova scritta di METODI PER LA GESTIONE DELL A CONOSCENZA C.d.L. in Informatica e Tecn. per la Prod. del Software - A.A. 20 16-17 Docent e: P. Lops - 14 Febbraio 20 17 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Descrivere l’ontologia linguistica WordNet ed indicare come è organizzata e rappresentata la conoscenza lessicale al suo interno. (PUNTI 6) 2) Siano dati l’insieme delle categorie C={ c1 ,c2 } e una collezione di 60 documenti definiti sul vocabolario V = {T1, T2, T3, T4, T5, T6}. Costruire un classificatore bayesiano per C, addestrandolo sul seguente training set TR: TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole con le relative occorrenze: T1 T2 T3 T4 T5 T6 D1 2 3 0 4 0 0 D2 1 0 2 0 0 0 D3 0 1 0 2 0 0 D4 0 2 0 0 4 0 e determinare la classe di appartenenza del seguente documento d={T 1:2,T6: 2} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore . (PUNTI 8) 3) Sia q una query che ha 5 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento applicato a q riporti il seguente ranking Rq: D3 D1 D5 D7 D9 D8 Supponiamo che D1 , D5 e D9 siano documenti rilevanti per q a) Calcolare Precision, Recall, ed Average Precision per q, fornendo anche una descrizione formale delle metriche (PUNTI 4) b) Supponendo di avere dei giudizi di rilevanza non binari, e assumendo che D1 e D9 abbiano un grado di rilevanza pari a 3, D5 abbia un grado di rilevanza pari a 2, e il resto dei documenti non siano rilevanti (grado di rilevanza pari a 0) , calcolare il valore del DCG (Discounted Cumulative Gain) per q, fornendo anche una breve descrizione della metrica. (PUNTI 5) 4) Descrivere in maniera sintetica i concetti fondamentali alla base del modello dei dati RDF, in particolare i concetti di risorsa, proprietà e statement. (PUNTI 7)