- userLoginStatus
Welcome
Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.
Informatica - Metodi per il ritrovamento dell'informazione
Full exam
Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 2018 -19 METODI PER LA GESTIONE DELLA CONSOCENZA C.d.L. in Informatica e Tecn. Per la Prod. del Software - Docente: P. Lops - 17 Luglio 2019 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Siano dati l’insieme delle categorie C = { c1,c2 } e un a collezione di 1000 documenti definiti sul vocabolario V = {T1,T2,T3,T4,T5 }. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze dei termini ne : D1={T1:2, T2: 1} D2={T1:1, T3:2} D3={T2:1, T4:2} D4={T2:2, T 3:4} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore (PUNTI 7) b) Determinare la classe di appartenenza del seguente documento d={T 3:1,T 5:2} (PUNTI 3) 2) Descrivere l’ontologia linguistica WordNet ed indicare come è organizzata e rappresentata la conoscenza lessicale al suo interno . (PUNTI 8) 3) Illustrare in maniera sintetica i seguenti problemi: a) Overspecialization nei recommender systems di tipo content -based (PUNTI 3) b) Cold -start nei recommender systems di tipo collaborativo (PUNTI 3) 4) Sia q una query che ha 6 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento riporti il seguente ranking R q (R indica che il documento è rilevante; N indica che il documento è non rilevante; il risultato più a sinistra è il top della lista): Rq: RRRNNNNRN N a) Fornire la descrizione sintetica della metrica: Average Precision (PUNTI 3) b) Calcolare l’Average Precision per la query q (PUNTI 3) Prova scritta di METODI PER IL RITROVAMENTO DELL’INFORMAZIONE C.d.L. in Informatica - A.A. 2018 -19 METODI PER LA GESTIONE DELLA CONSOCENZA C.d.L. in Informatica e Tecn. Per la Prod. del Software - Docente: P. Lops - 17 Luglio 2019 Nome e Cognome : ___________________________________________ Matricola : ___________________________________________ 1) Siano dati l’insieme delle categorie C = {c1,c2 } e un a collezione di 1000 documenti definiti sul vocabolario V = {T1,T2,T3,T4,T5 }. a) Costruire un classificatore bayesiano per C , addestrandolo sul seguente training set TR : TR = {, , , } dove per ogni documento si riporta di seguito l’elenco delle parole in esso presenti, con le relative occorrenze dei termini ne : D1={T1:2, T2: 1} D2={T1:1, T3:2} D3={T2:1, T4:2} D4={T2:2, T 3:4} NB: illustrare chiaramente tutte le fasi di costruzione del classificatore (PUNTI 7) b) Determinare la classe di appartenenza del seguente documento d={T 3:1,T 5:2} (PUNTI 3) 2) Descrivere l’ontologia linguistica WordNet ed indicare come è organizzata e rappresentata la conoscenza lessicale al suo interno . (PUNTI 8) 3) Illustrare in maniera sintetica i seguenti problemi: a) Overspecialization nei recommender systems di tipo content -based (PUNTI 3) b) Cold -start nei recommender systems di tipo collaborativo (PUNTI 3) 4) Sia q una query che ha 6 documenti rilevanti nella collezione. Supponiamo che un algoritmo di ritrovamento riporti il seguente ranking R q (R indica che il documento è rilevante; N indica che il documento è non rilevante; il risultato più a sinistra è il top della lista): Rq: RRRNNNNRNN a) Fornire la descrizione sintetica della metrica: Average Precision (PUNTI 3) b) Calcolare l’Average Precision per la query q (PUNTI 3)