- userLoginStatus
Welcome
Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.
Informatica - Metodi per il ritrovamento dell'informazione
01. Calcolo delle similarità
Divided by topic
Calcolo della similarità tra vettori x,y : vettori non normalizzati in uno spazio a N dimensioni x’, y’: vettori x, y normalizzati con una qualche strategia sim(x,y) = prodotto interno cossim(x,y) = similarità del coseno Caso 1: Vettori non normalizzati d1=(5,1,2) d2=(0,1,1) d=(1,2,1) sim(d, d 1) = 5+2+2=9 sim(d, d 2) = 0+2+1=3 Risultato: d 1 è più simile a d che d2 Risultato: d 2 è più simile a d che d1 Caso 2: Vettori normalizzati con strategia del coseno d1=(5,1,2) |d1| = = d2=(0,1,1) |d2| = = d=(1,2,1) |d| = = 671,0 180 9 | || | ) , ( 30 6 9 30 6 2 2 5 ) d cossim(d, 1 1 1 d d d d sim 866,0 12 3 | || | ) , ( 2 6 3 2 6 1 2 0 ) d cos s im(d, 2 1 2 d d d d sim 2 2 2 2 1 5 30 2 2 2 1 1 0 2 2 2 2 1 2 1 6 ) 30 2 , 30 1 , 30 5 ( d'1 ) 2 1, 2 1, 2 0( d'2 ) 6 1, 6 2 , 6 1( d' 671,0 180 9 ) , ( cos | || | ) , ( 30 6 9 30 6 2 30 6 2 30 6 5 ) d', sim(d' 1 1 1 1 d d sim d d d d sim Risultato: d 2 è più simile a d che d1 Caso 3: Vettori normalizzati con strategia del peso massimo d1=(5,1,2) peso max=5 d2=(0,1,1) peso max=1 d=(1,2,1) peso max=2 |d1| = = = |d2| = = |d| = = = Risultato: d 2 è più simile a d che d1 Caso 4: Vettori normalizzati con strategia della somma delle coordinate d1=(5,1,2) somma =8 d2=(0,1,1) somma =2 d=(1,2,1) somma =4 |d1| = = = |d2| = = 866,0 12 3 ) , ( cos | || | ) , ( 2 6 3 2 6 1 2 6 2 2 6 0 ) d', sim(d' 2 2 2 2 d d sim d d d d sim )52,51 (1, d'1 2 2 2 52 51 1 255 1 56 (0,1,1) d'2 2 2 2 1 1 0 2 )21 ,1,21( d' 2 2 2 21 1 21 21 1 23 90,0 109 51 51 21 ) d', sim(d' 1 50,1 21 1 0 ) d', sim(d' 2 671,0 10 18 109 23 56 51 51 21 ) d', cos sim(d' 1 866,0 3 23 23 2 21 1 0 ) d', cossim(d' 2 )82,81,85( d'1 2 2 2 82 81 85 64 30 32 15 )21,21 (0, d'2 2 2 2 21 21 0 21 |d| = = Risultato: d 2 è più simile a d che d1 )41,42,41( d' 2 2 2 41 42 41 83 28,0 329 322 322 325 ) d', sim(d' 1 50,0 82 82 0 ) d', sim(d' 2 671,0 256 45 329 83 32 15 322 322 325 ) d', cos s im(d' 1 866,0 163 83 83 21 81 41 0 ) d', cos s im(d' 2