logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Computer Engineering - Statistica e Calcolo delle Probabilià

Raccolta temi d'esame A.A. 21-22

Other

Politecnico di Milano Temi d'esame di 099319-Probabilita e statistica per l'informatica dell'AA 2020/21 per ING-INF (laurea) Docenti: Federico Bassetti, Ilenia Epifani, Lucia Ladelli18 febbraio 2022 1 2 I Prova in Itinere di PSI, Bassetti, Epifani, Ladelli, 21.04.2021 ©I diritti d'autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Giusticare adeguatamente tutte le risposte. 1 Domande di teoria D 1SiaX= (X 1; X 2; X 3) un vettore aleatoriotridimensionalecon funzione di ripartizioneF X( t 1; t 2; t 3) , (t 1; t 2; t 3) 2R3 . (a)Cosa vuole dire cheXè un vettore assolutamente continuo di densitàf X? (b)Dimostrare cheX 3è assolutamente continua e determinare la sua densità in funzione della densità fXdel vettore. (c)Sia oraW=g(X 1; X 2; X 3) una v.a. funzione delle componenti diX. Fornire una condizione suciente per l'esistenza del valore atteso diWe fornirne l'espressione utilizzando la densità del vettoreX. Soluzione (a)Si veda: Appunti di calcolo delle probabilità, Denizione 4.4.1 pern= 3. (b)Si veda: Appunti di calcolo delle probabilità, Proposizione 4.4.3 e sua dimostrazione pern= 3. (c)Si veda: Appunti di calcolo delle probabilità, Proposizione 4.7.1 seconda parte dell'enunciato.D 2 Sia( ;F; P)uno spazio di probabilità e sianoA; B; Ctre eventi. (a)Dire quando gli eventiA; B; Csono a due a due incompatibili; (b)dire quandoA; B; Csono (mutuamente) indipendenti; (c)dire quandoAeBsono condizionatamente indipendenti datoC; (d)seA; B; Csono indipendenti, alloraAeBsono condizionatamente indipendenti datoC? Giusticare adeguatamente la risposta. Soluzione(a)Gli eventiA; B; Csono a due a due incompatibili seA\B=A\C=B\C=;; (b)A; B; Csono (mutuamente) indipendenti se valgono tutte le seguenti fattorizzazioni: P(A\B) =P(A)P(B); P(A\C) =P(A)P(C); P(B\C) =P(B)P(C); P(A\B\C) =P(A)P(B)P(C) (c)SeP(C)>0si dice cheAeBsono condizionatamente indipendenti datoCse P(A\BjC) =P(AjC)P(BjC) (d)Sì, seA; B; Csono indipendenti, alloraAeBsono condizionatamente indipendenti datoC: si osservi che se seA; B; Csono indipendenti alloraP(A\B\C) =P(A)P(B)P(C)eP(A) =P(AjC), P(B) =P(BjC)da cui P(A\BjC) =P (A\B\C)P (C)= P (A)P(B)P(C)P (C)= P(A)P(B) =P(AjC)P(BjC)1 2 Esercizi Esercizio 1Un ingegnere informatico programma e addestra un classicatore binario per identicare transazioni bancarie fraudolente. Al termine della fase di addestramento, stima che il classicatore ha sensibilità cioè probabilità di riconoscere correttamente una transazione fraudolenta pari a90%e specicità cioè probabilità di identicare come innocua una transazione eettivamente non fraudolenta pari a98:5%. Inoltre, si sa che la probabilità che una transazione sia fraudolenta èp= 0:0035, (cioè 350 transazioni bancarie su100 000sono fraudolente). (a)Determinare la probabilità che il classicatore identichi una nuova transazione bancaria comefraudolenta; (b)determinare ilvalore predittivo positivodel classicatore, cioè la probabilità che una transazione bancaria identicata dal classicatore come fraudolenta lo sia realmente. Il valore predittivo del classicatore ottenuto al punto (b) non è però soddisfacente e l'ingegnere informa- tico deve riprogrammare il suo classicatore: (c)determinare il minimo valore di specicità (a parità di probabilitàp= 0:0035e sensibilità = 90%) anché ilvalore predittivo positivodel classicatore sia almeno pari a0:5. SoluzioneSianoM ; Fgli eventi deniti daM:La nuova transazione bancaria è fraudolenta,F:La nuova transazione bancaria è identicata dal classicatore come fraudolenta per i quali sono stati forniti i seguenti valori di probabilità: =P(FjM) = 0:90; =P(Fc jMc ) = 0:985; p=P(M) = 0:0035 Allora:(a)per la formula delle probabilità totali, la probabilità che il classicatore identichi una nuovatransazione bancaria come fraudolenta è P(F) =P(FjM)P(M) +P(FjMc )P(Mc ) = p+ (1 )(1p) = = 0:900:0035 + 0:0150:9965 = 0:0180975'0:0181 (b)per la formula di Bayes, il valore predittivo positivo PPV del classicatore è P P V=P(MjF) =P (FjM)P(M)P (F)= p p + (1 )(1p)= 0 :900:00350 :0180975' 0:1741 (c)occorre determinare tale che 0:900:00350 :900:0035 + (1 )0:9965 0:5 cioè0:900:0035 + (1 )0:99650 :900:00350 :5 cioè 10 :900:00350 :9965' 99:68%Esercizio 2 In uno studio sulle polveri sottili, l'ecienza di abbattimento del PM10 di un certo impianto è stata modellata con una variabile aleatoriaXassolutamente continua di densità fX( x) =( cx4 sex2(0;1) 0sex62(0;1) 2 (a)ricavare la costante ce calcolare la probabilità che l'ecienza di abbattimento del PM10 dell'im- pianto sia superiore a 0.9; (b)determinare la densità della variabile aleatoriaY=p lnX, dovelnindica il logaritmo in base naturale, e dedurne la sua intensità di guasto. Soluzione (a)Dalla condizioneZ 1 0cx 4 dx= 1si ricavacx 55 1 0= c5 = 1 e quindic= 5; segue che la probabilità cercata èP(X >0:9) =Z 1 0:95 x4 dx=x5 1 0:9= 1 0:95 = 0:40951 (b)si parte dalla determinazione della f.d.r. diY=p lnX; dap lnx >0per ogni0< x 0si ha: FY( y) =P(p lnXy) =P(Xe y2 ) = 1F X(e y2 ) che ha derivataF0 Y( y) = 2ye y2 fX(e y2 ) = 10ye 5y2 Segue chef Y( y) = 10ye 5y2 1(0;1)( y), cioèYWeib(2;5)che ha intensità di guasto Y( y) = 25y2 1 = 10y(y >0).Esercizio 3 Si eseguono 4 estrazioni senza reimmissione da un'urna contenente 6 palline di cui 1 azzurra, 2 rosa e 3 viola. SianoXil numero di palline azzurre ottenute eYil numero di rosa. (a)Determinare la tabella della densità congiuntap X;Ydi X; Ye le densità marginali di X e Y; (b)calcolare la probabilità di ottenere meno palline azzurre che rosa, cioèP(X < Y); (c)calcolare la media diXe diYe la media del prodotto(X+ 1)(Y1); le v.a.X; Ysono indipendenti? Giusticare adeguatamente la risposta. SoluzioneLa seguente tabella rappresenta ogni coppia di modalità di vettore aleatorio(X; Y)in termini di numero di palline azzurre (A), rosa (R) e viola (V): XnY012 0;0 A; 1R; 3V0 A; 2R; 2V11 A; 0R; 3V1 A; 1R; 2V1 A; 2R; 1VLo schema è quello di n= 4estrazione senza reimmissione da insieme di 6 palline per cui i possibili risultati delle 4 estrazioni sono 6 4 = 15; invece i casi possibili all'evento(X= 0; Y= 1) =f0A; 1R; 3Vg sono 2 1 3 3 = 2e così via per gli altri eventi. (a)Segue che la densitàp X;Ypuò essere rappresentata dalla seguente tabella a doppia entrata XnY012p X002 =153 =152 =15 + 3=15 = 1=3 11 =156 =153 =151 1=3 = 2=3p Y1 =152 =15 + 6=15 = 8=153 =15 + 3=15 = 6=151 le densità marginali di Xe diYsono state ottenute rispettivamente sull'ultima colonna (sommando per riga) e sull'ultima riga (sommando per colonna). 3 (b)La probabilità di ottenere meno palline azzurre che rosa è P(X < Y) =p X;Y(0 ;1) +p X;Y(0 ;2) +p X;Y(1 ;2) =815 (c)Per la media diXsi osserva cheXBe(2=3)da cuiE(X) =23 ' 0: 6; invece perYsi ha: E(Y) =1 815 + 2 615 = 43 = 1 : 3 e perE((X+ 1)(Y1)): E((X+ 1)(Y1)) = E(X Y)E(X) + E(Y)1 =715 = 0 :4 6 dal momento cheE(X Y) =1 1615 + 1 2315 = 45 = 0 :8 Inne, si osserva che seX; Ysono indipendenti alloraE(g 1( X)g 2( Y)) = E(g 1( X)) E(g 2( Y))8g 1; g 2; poiché E((X+ 1)(Y1)) =715 6 =59 = 53  13 = [E( X) + 1][E(Y)1] alloraX; Ynon sono indipendenti.Esercizio 4 Si testano in modo indipendente 6 tipi diversi (A; B; C; D; E ; F) di spray insetticida, ciascuno su una singola cella agricola sperimentale, e il numero di insetti superstiti nella cella agricola sperimentale iè una variabile aleatoria di Poisson di parametro iriportato in tabella: A B C D E F3.03.922.318.26.338.6 (a)Calcolare la probabilità che nella due celle agricole trattate una con lo spray insetticida Ae l'altra colBsopravvivano in totale esattamente 9 insetti; (b)approssimare la probabilità che nelle 6 celle in totale sopravvivano meno di 105 insetti. SoluzioneSianoX A Pois( A) ,: : : ; X F Pois( F) le variabili aleatorie indipendenti che modellano i numeri degli insetti superstiti nelle celle agricole sperimentali trattate rispettivamente con gli spray A; : : : ; F. Deriva quanto segue. (a)La probabilità che nelle due celle agricole trattate con gli sprayAeBsopravvivano esattamente 9 insetti èP(X A+ X B= 9) ; per la proprietà di riproducibilità della densità di Poisson:X A+ X B Pois( A+  B) = Pois(6:9)cosicché P(X A+ X B= 9) = p XA+ X B(9) =e 6:9 6:999! ' 0:0985: (b)La probabilità che nelle 6 celle in totale sopravvivano meno di 105 insetti èP(X A+   +X F< 105); si osserva che la sommaX A+   +X Fha densità di Poisson di parametro  A+   + F= 92 :3e92:3 è un numero grande; quindi un valore approssimato della probabilità cercata si ottiene applicando il teorema centrale del limite: P(X A+   +X F< 105) =P(X A+   +X F 104)' 10492:3p 92 :3 '(1:22)'0:8888 con la correzione di continuità il valore approssimato è: P(X A+   +X F< 105) =P(X A+   +X F 104:5)' 104:592:3p 92 :3 '(1:27)'0:89801 .1 il valore esatto diP(X A+   +X F< 105), arrotondato alla quarta cifra decimale, è0:8962. 4 II Prova in Itinere di PSI, Bassetti, Epifani, Ladelli, 17.06.2021 ©I diritti d'autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Giusticare adeguatamente tutte le risposte. 1 Domande di teoria D 1SiaX 1; : : : ; X nun campione aleatorio estratto da una popolazione di densità f #nota a meno del parametro incognito#e sia(#)una caratteristica della popolazione. SiaT n= t(X 1; : : : ; X n) uno stimatore puntuale di(#). (a)Denire l'errore quadratico medio diT ncome stimatore di (#); (b)fornire e dimostrare la decomposizione dell'errore quadratico medio in termini di varianza e distor-sione; (c)se la distorsione diT ncome stimatore di (#)è uguale a2=ne la varianza diT nè uguale a 2 (#)=n, quale espressione ne risulta per l'errore quadratico medio diT n 2=ncome stimatore di(#)? Soluzione(a)SeT nè uno stimatore di (#)tale cheE # (T n (#))2 0. Si supponga assegnata una regione criticaCper il problema di verica d'ipotesi H0: #1versusH 1: # >1 (a)Dare la denizione di errore di primo tipo; (b)dare la denizione di curva OC, (#), del test con regione criticaC; 1 (c)supponendo che (#) = e 0:1# (per# >0), calcolare il livello di signicatività del test in esame. Soluzione(a)Si commette un errore di primo tipo quando si riuta l'ipotesi nullaH 0: #1maH 0è vera ossia quando(X 1; : : : ; X n) 2Ce#1; (b)la curva OC è (#) =P #( si accettaH 0 ) =P #(( X 1; : : : ; X n) = 2C)# >0 (c)il livello di signicatività del test in esame èsup 00. Inoltre Var#( S) = Var(X) + Var(Y) = 2 Var#( W) = Var(X) +#2 Var(Y) = 1 +#2 Cov#( S; W) = Cov(X; X)#Cov(X; Y) + Cov(Y ; X)#Cov(Y ; Y) = 1# In conclusione la distribuzione congiunta diS; Wè gaussiana bivariata con vettore delle medie(0;0) e matrice di covarianza 2 1# 1#1 +#2 (b)Essendo(S; W)un vettore gaussiano, si ha cheSeWsono indipendenti se e solo se hanno covarianza nulla, il che accade se e solo seE #( S W) = E #( S) E #( W). La covarianza fraSeWè nulla se e solo se0 = 1#, ossia se e solo se#= 1. 3 (c)Dai punti precedenti Var #( W) = E(W2 ) = 1 +#2 edE #( W) = 0. Essendo la media nota e uguale a 0, uno stimatore non distorto della varianza2 Wdi Wè dato da S2 0=15 5 X i=1W 2 i Ne segue che uno stimatore non distorto di#2 è b 2 =S2 0 1 Inoltre uno stimatore intervallare bilatero di condenza1 per la varianza2 Wdi un campione gaussianoW 1; : : : ; W 5con media nota è dato 5S2 0 2 =2;5<  2 W0allora un intervallo bilatero di condenza1 per#2 si ottiene considerando 5S2 0 2 =2;5 1;5 S2 0 2 1 =2;5 1! \(0;+1) Con i dati forniti, la stima di2 Wè s2 0= 2 :42042e quella di#2 èb #2 = 1:42042; inne la stima intervallare al 95% di#2 è 52:4204212 :83 1;5 2:420420 :83 1 \(0;+1)'(0;13:5808)Esercizio 3 SiaX 1; : : : ; X nun campione proveniente dalla densità f#( x) =12 #exp j x+ 5j#  1< x 0è un parametro incognito. (a)Determinare lo stimatore di massima verosimiglianzab ndi #; (b)determinare la distorsione e l'errore quadratico medio dib ncome stimatore di #; (c)determinare la distribuzione asintotica dello stimatoreb ne costruire una quantità pivotale asintotica partendo da esso. Soluzione1.Per ogni realizzazione campionariax 1; : : : ; x nsi ha `(#) = lnn Y k=1f #( x k) =n X k=1ln f #( x k) = nln 2nln#1# n X k=1j x k+ 5 j e`0 (#) =n# + 1# 2n X k=1j x k+ 5 j 0()#1n n X k=1j x k+ 5 j da cuib n=P n k=1j X k+ 5 jn 4 2. b nè corretto per #in quanto per ogni# >0: E#(b n) = E #( jX 1+ 5 j) =12 #Z +1 1j x+ 5je j x+5j# dx=12 #Z +1 1j xje j xj# dx=1# Z +1 0x e x# dx=# quindiMSE#(b n) = Var #(b n) =Var #( jX 1+ 5 j)n = # 2n in quanto E#( jX 1+ 5 j2 ) =12 #Z +1 1( x+ 5)2 e j x+5j# dx=12 #Z +1 1x 2 e j xj# dx=1# Z +1 0x 2 e x# dx= 2#2 3.Si osserva cheb n= n 1P n k=1j X k+ 5 jè la media campionaria delle v.a. i.i.d.Y k= jX k+ 5 je il teorema centrale del limite fornisce cheb nè asintoticamente gaussiano di media #e varianza #2 =n. Ne segue chepn (b n #)=# N(0;1), che è una quantità pivotale asintotica in quanto la sua distribuzione asintotica non dipende da#. Alternativamente si osserva cheY k= jX k+ 5 j E(1=#)8ke per la proprietà di riproducibilità delle densità gamma:P n k=1Y k (n;1=#); poi la proprietà di scala fornisceb n  n;n#  e 2nb n#   n;12  =2 (2n) Quindi2nb n=# è una quantità pivotale per ognine quindi anche asintotica.5 I Appello di PSI, Bassetti, Epifani, Ladelli, 05.07.2021 Cognome e Nome: Codice Persona: Matricola: ©I diritti d'autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Giusticare adeguatamente tutte le risposte. 1 Domande di teoria D 1(a)Enunciare il Teorema centrale del limite. (b)SianoX 1; : : : ; X 10i.i.d. e X i (10;1). Calcolare, giusticando adeguatamente,P(X 1+   +X 10 90): Soluzione(a)Teorema 4.11.6 pagina 111 degli Appunti di calcolo delle probabilità di Epifani, Ladelli, Posta,AA 2019/20:(b)Per la proprietà di riproducibilità della densità gamma, X 1+   +X 10 (100;1)che può essere pensata come la distribuzione della somma di100v.a. indipendenti esponenziali di parametro 1; segue dal teorema centrale del limite che P(X 1+   +X 10 90)' 90100p 100  = 1(1)'10:8413 = 0:1587D 2 SiaX 1; : : : ; X nun campione aleatorio di dimensione nestratto da una popolazione con mediae varianza2 incognite. (a)Fornire uno stimatore puntuale della varianza della popolazione. (b)Calcolare (fornendo i passaggi necessari) la distorsione dello stimatore proposto. Soluzione (a)S2 n=P n j=1( X jX n)2n 1con n2 (b)Poiché E(S2 n) = E P n j=1X2 j nX 2n 1! =1n 1 n(2 +2 )n 2n + 2 =2 allora la distorsione diS2 ncone stimatore di jsigma2 è nulla.1 D 3 SiaTuna variabile aleatoria positiva assolutamente continua. (a)Fornire la denizione di intensità di guasto(t)diT. (b)Ricavare, sviluppando gli opportuni calcoli, la formula che fornisce la funzione di ripartizione diT a partire da(t). Soluzione (a)Sianof T; F Tla densità e la f.d.r. di T. Allora(t) =f T( t)1 F T( t)per t >0 (b)Per ognit >0vale che Zt 0 (s)ds=Z t 0f T( s)1 F T( s)ds =ln(1(F T( t)) in quantoln(1(F T(0)) = ln(1 0) = 0, da cui deriva che FT( t) = 1eR t 0 (s)ds2 Esercizi Esercizio 1Marco è tornato al lavoro in presenza. Ogni mattina per raggiungere il suo posto di lavoro può scegliere fra i due percorsiAeB: dal passato si sa che il 60% delle mattine sceglie l'Ae le rimanenti 40%ilB. Seguendo il percorsoA, Marco impiega un tempo espresso in minuti che è una variabile aleatoria assolutamente continuaXdi densità fX( x) =( 236 2 (66 x)se30< x 0ey >0 0altrove (a)CalcolareE 2Y +X ; (b)calcolare le densità marginalif Xdi Xef Ydi Y; (c)usando le proprietà della covarianza, determinareCov(X+Y ; YX). Soluzione (a)E 2Y +X =Z Z R22x +yf X;Y( x; y)dxdy=Z Z (0;1)2e (x+y) dxdy=Z 1 0e x dx |{z} 1 Z 1 0e y dy |{z} 1= 1 (b)Per ragioni di simmetria,X; Yhanno le stesse densità marginalif X( s) =f Y( s)conf X( s) = 0se s 0si ha fX( s) =Z +1 0f X;Y( s; y)dy=Z +1 012 ( s+y)e (s+y) dy =12 e s0 B B @sZ +1 0e y dy |{z} 1+ Z +1 0y e y dy |{z} 11 C C A =12 e s (s+ 1) (c)Cov(X+Y ; YX) = Cov(X; Y)Var(X)+Var(Y)Cov(Y ; X) = 0perchéX; Ysono identicamente distribuite e quindi hanno la stessa varianza e perché la covarianza è simmetrica per cuiCov(X; Y) = Cov(Y ; X).Esercizio 3 Siax = 9:59la media campionaria registrata su di un campioneX 1; : : : ; X 10i :i:d:  N(;2:25). (a)VericareH 0: = 9:9controH 1: 6 = 9:9al10%. (b)Se la mediaè in realtà9:0con quale probabilità si prende la decisione sbagliata? Si è disposti ad allargare il campione per fare inferenza su. (c)Determinare la minima lunghezzandel campioneX 1; : : : ; X ni :i:d:  N(;2:25)tale che la lunghezza di un intervallo bilatero perdi condenza90%non superi0:52. Soluzione 3 (a)Uno stimatore intervallare simmetrico (nella media campionaria) di livello (1 )%della mediaper popolazione gaussiana con varianza nota ha estremiX z 2 =pn . Con i dati a nostra disposizione:  x 10= 9 :59,2 = 2:25,n= 10,z 2 = z 0:05' 1:645otteniamo la stima intervallare8:81<  1 (a)Calcolare la densità diX; (b)determinare funzione di ripartizione e densità diY= lnX; (c)determinare la legge diZ= ln(X 1 X 2) . Soluzione (a)La densitàf Xdi Xsi ottiene facilmente per derivazione, avendo osservato cheF Xè continua ovunque e derivabile ovunque tranne inx= 1. In particolare fX( x) =( 0sex1 4x 5 se x >1 (b)Si haFY( y) =P(Yy) =P(lnX 1 y) =P(X 1 ey ) =F X(ey ) Quindi, pery >0, dal momento cheey >1, alloraF Y( y) =F X(ey ) = 1e 4y , mentre pery0 si haey 0 2 (c)Si ha Z= lnX 1+ ln X 2= Y 1+ Y 2. Per il punto precedente Y 1; Y 2i :i:d:  E(4), quindi la loro somma ha legge(2;4)(proprietà di riproducibilità).Esercizio 2 SiaXil numero di giorni passati in ospedale dopo un dato intervento chirurgico eYil numero di ricoveri nei 24 mesi successivi all'intervento. Si supponga che la legge del vettore aleatorio (X; Y)sia descritta dalla tabellaX = 4X = 5X = 6Y = 03 =242 =241 =24Y = 11 =243 =242 =24Y = 21 =242 =242 =24Y = 32 =242 =243 =24(a)Calcolare la probabilità che un soggetto resti in ospedale dopo l'intervento per non più di 5 giorni. (b)Calcolare il numero medio di giorni passati in ospedale dopo l'intervento. (c)Sapendo che una persona ha passato esattamente 5 giorni in ospedale dopo l'intervento, determinarela probabilità che non sia mai ricoverato nei 24 mesi successivi. Soluzione(a)La densità di probabilità marginale diXè data daP(X= 4) = 7=24,P(X= 5) = 9=24,P(X= 6) = 8=24, quindi la probabilità cercata è FX(5) = P(X5) =P(X= 4) +P(X= 5) =724 + 924 = 23 (b)Usando le probabilità marginali del punto precedente E(X) = 4724 + 5 924 + 6 824 = 12124 ' 5:042 (c)Si deve calcolareP(Y= 0jX= 5) =P (X= 5; Y= 0)P (X= 5)= 224  249 = 29 Esercizio 3 Si vuole testare un nuovo tipo di ltro per l'acqua di rubinetto. L'ucio commerciale dell'azienda produttrice aerma che il ltro garantisce una riduzione media della quantità di piombo per litro superiore a 5g per litro. Il laboratorio di statistica misura la quantità di piombo (g per litro) prima e dopo l'utilizzo del ltro in 10 diversi appartamenti. Di seguito sono riportate, ing per litro, le misurazioni del campione in esame prima e dopo l'utilizzo del ltro. X: senza ltro (prima)18.69 19.28 16.33 18.19 18.38 18.96 17.54 17.10 17.51 17.79 Y : con ltro (dopo)11.63 10.03 13.16 12.95 9.44 10.99 12.02 12.04 10.06 12.03 D : dierenza7.06 9.25 3.17 5.24 8.94 7.97 5.52 5.06 7.45 5.76 per le quali si hanno le seguenti statistiche:X = 17:977; S2 X' 0:812;Y = 11:435; S2 Y' 1:602;D = 6:542; S2 D' 3:682 Si assuma che le misurazioni siano variabili aleatorie normali (gaussiane). 3 (a)Determinare un intervallo di condenza bilatero di livello 95% per la dierenza media di quantità di piombo in un litro d'acqua fra prima e dopo l'utilizzo del ltro. (b)Valutare tramite un test con signicatività 5% se l'ucio commerciale può davvero aermare che illtro riduce il piombo nell'acqua di più di5g per litro. (c)Determinare ilp-value del test usato nel punto precedente (fornire un intervallo che contenga il valore delp-value). Soluzione(a)L'intervallo di condenza cercato ha estremiD t 0:025;9rS 2 D10 = 6 :5422:262r3 :68210 quindi è5:169<  X  Y< 7:915. (b)Si considera come ipotesi nullaH 0:  D=  X  Y 5e come alternativaH 1:  D> 5e si usa il t-test per il confronto di medie con dati accoppiati che riutaH 0al 5%se T0=(D 5)p10 q S 2 D t 0:05;9 In questo caso si han= 10, d= 6:542,s2 D' 3:682e quindiT 0assume il valore t 0' 2:541. Poiché t0:05;9' 1:833si riutaH 0e si conclude che si può aermare al livello 5%che il ltro riduce il piombo più di 5g per litro. (c)Ilp-value del test valeP(T 9 2:541)'0:0158; usando le tavole che avete a disposizione si può arrivare solo ad aermare che ilp-value cade nel seguente intervallo(0:010;0:025), dal momento che 0:010'P(T 9> 2:821)< P(T 9> 2:541)< P(T 9> 2:262)'0:025Esercizio 4 SiaX 1; : : : ; X nun campione aleatorio con intensità di guasto costante e uguale a (t) = 1=# pert >0. (a)Dopo aver riconosciuto la densità notevolef #da cui il campione è estratto, determinare lo stimatore di massima verosimiglianzab ne lo stimatore dei momentib Tndi #e stabilire se coincidono. (b)Stabilire seb nè non distorto e consistente in media quadratica. Facendo appello ad un opportuno teorema, determinare pern= 100la distribuzione asintotica dib n. (c)Sempre pern= 100, calcolare un valore approssimato diP(^ n< # 1:128). Dedurne un intervallo asintotico di condenza al 90% per#illimitato superiormente. Soluzione(a)Poiché l'intensità di guasto è costante, segue che la densità del campione è esponenziale con para-metro uguale all'intensità di guasto1=#. La funzione di log-verosimiglianza del campione è `(#) = lnn Y i=1f #( x i) = nln#n X i=1x i# da cui`0 (#) =n# +n X i=1x i# 2 0 4 se e solo se #P i=1x in ne segue che l'M.L.Eb ndi #è la media campionariaX n. L'unica equazione da impostare per il metodo dei momenti èX n= E( X 1) = # da cui si ottieneb Tn=b n=X n. (b)Per la non distorsione osserviamo che dalle proprietà della media E#(X n) = E #( X 1) = # Quindib nè non distorto per #, per ognin. Ne segue che M S E#(X n) = Var #(X n) =Var #( X 1)n = # 2n che tende a zero pern!+1. Quindi si ha la consistenza in media quadratica. Sen= 100 possiamo applicare il teorema centrale del limite e ottenere cheX n N (#; #2 =n). (c)Dalla distribuzione asintotica ottenuta al punto precedente si ha P(X n #1:128) =PX n ##= 10< # (1:1281)10#  '(1:28)'0:90 Ne segue che l'intervallo richiesto è #2X n1 :128; +15 III Appello di PSI, Bassetti, Epifani, Ladelli, 26.01.2022 Cognome e Nome: Codice Persona: Matricola: ©I diritti d'autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Giusticare adeguatamente tutte le risposte. 1 Domande di teoria D 1(a)Enunciare e dimostrare la formula delle probabilità totali; (b)applicare la formula delle probabilità totali per calcolare la probabilità di ottenere testa se si lanciauna moneta scelta a caso fra due moneteAeBtali cheAha trucco (probabilità di ottenere testa) 0:25eB0:75. Soluzione(a)Proposizione 1.5.9 pagina 18 degli Appunti di calcolo delle probabilità di Epifani, Ladelli, Posta,AA 2019/20. (b)P(T) =P(TjA)P(A) +P(TjB)P(B) = (0:25 + 0:75)0:5 = 0:5, doveTè l'evento esce testa,A= lancio la monetaAcon trucco0:25 eB=lancio la monetaBcon trucco0:75.D 2 (a)Enunciare il teorema centrale del limite; (b)applicare il teorema centrale del limite per ottenere un valore approssimato diP(S35)con SBi(90;0:5) Soluzione(a)Teorema 4.11.6 pagina 114 degli Appunti di calcolo delle probabilità di Epifani, Ladelli, Posta,AA 2019/20. (b)Sappiamo che la somma di90v.a. i.i.d. bernoulliane di parametro0:5ha distribuzioneBi(90;0:5). Dunque possiamo pensareScome la sommaS=P 90 j=1X j, con X 1; : : : ; X 90i :i:d: Be(0:5)con E(X 1) = 0 :5eVar(X 1) = 0 :25. Segue dal teorema centrale del limite che la standardizzata diSha legge asintoticada cui ricaviamo (con la correzione di continuità): P(S35) =P(S35:5)' 35:5900:5p 90 0:25 '(2:00) = 1(2:00)'10:9772 = 0:0228D 3 (a)Siax 1; : : : ; x nla realizzazione campionaria del campione casuale X 1; : : : ; X nestratto dalla popo- lazionef #con #2parametro unidimensionale incognito. Fornire la denizione di stimatore di massima verosimiglianza di#. 1 (b)Si supponga ora: n= 1; x 1= 0 :3; f #( x) =( #x# 1 0< x 0 0altrimenti (a)Calcolare la probabilitàp Cche il componente Csia guasto al tempot= 1:2; (b)calcolare la probabilità che il sottosistema in serie formato dai componentiA; Bsia funzionante al tempot= 1:2; (c)dopo aver disegnato lo schema dell'intero sistema, calcolarne l'adabilità al tempot= 1:2, cioè la probabilità che l'intero sistema funzioni al tempot= 1:2. 2 Soluzione (a)La probabilitàp Cche il componente Csia guasto al tempot= 1:2è data da pC=Z 1:2 02 t9 e t 29 dt= 1e 1 :229 = 1e 0:16 '0:1479 (b)La probabilità che il sottosistema in serie formato dai componentiA; Bsia funzionante al tempo t= 1:2vale(1p A)(1 p B) = (1 0:02)(10:048) = 0:93296. (c)Lo schema del sistema totale è t tA B C Da cui segue che l'adabilità dell'intero sistema al tempo1:2è data dalla formula (1p A)(1 p B) + (1 p C) (1p A)(1 p B)(1 p C) = = 0:93296 + (10:1479)0:93296(10:1479)'0:9901 In modo equivalente, l'adabilità dell'intero sistema al tempo1:2si ottiene dalla formula 1[1(1p A)(1 p B)] p C' 0:9901Esercizio 2 Sia 0 @X 1 X2 X31 A N(;)con=0 @ 1 0 21 Ae =0 @4 1 1 :5 1 1 0 1:5 0 11 A (a)Calcolare valore atteso e varianza diY= 0:43X 1+ 0 :50X 2 0:75X 3. (b)Qual è la distribuzione diY? (Giusticare adeguatamente la risposta) (c)Stabilire, giusticando la risposta, seX 2e X 3sono indipendenti e determinare F X2;X 3(1 :11;3:11), ossiaPfX 2 1:11; X 3 3:11g. Soluzione(a)E(Y) = E(0:43X 1+ 0 :50X 2 0:75X 3) = 0 :43 1+ 0 :50 2 0:75 3= 0:431:5 =1:93 Var(Y) = 0:432 11+ 0 :502 22+ 0 :752 33+ 2 0:430:50 12 20:430:75 13 = 0:432 4 + 0:502 1 + 0:752 1 + 20:430:50120:430:751:5 = 1:0146 (b)EssendoYuna combinazione lineare di v.a. congiuntamente gaussiane è una variabile aleatoria gaussiana. Media e varianza sono state calcolate al punto precedente, quindiY N(1:93;0:6921). (c)Segue dalle proprietà dei vettori gaussiani cheX 2e X 3sono indipendenti con X 2 N (0;1)e X3 N (2;1); infatti,X 2; X 3sono congiuntamente gaussiani in quanto (X 2; X 3) è un sottovettore gaussiano e variabili aleatorie congiuntamente gaussiane con covarianza nulla sono indipendenti; inoltre le medie e le varianze diX 2; X 3si estraggono rispettivamente dal vettore media e dalla matrice di covarianza. Quindi FX2;X 3(1 :11;3:11) =F X2(1 :11)F X3(3 :11) = (1:11)(1:11)'0:86652 '0:75083 Esercizio 3 L'aziendaxxxha acquistato un'imbottigliatrice automatica di oli essenziali. A causa delle uttuazioni casuali la quantità di olio essenziale dosata dall'imbottigliatrice è una variabile aleatoria normaleXdi mediae varianza2 entrambe incognite. Sospettando che la quantità mediadi olio essenziale imbottigliato sia minore di50 mle che la deviazione standarddel contenuto di una bottiglietta sia maggiore di2 ml, si controllano glimlx idi un certo olio essenziale contenuto in un campione casuale di100bottigliette e si ottiene 100 X i=1x i= 5017 :4e100 X i=1x 2 i= 252150 :0 (a)Fornire uno stimatore non distorto per la mediae uno per la varianza2 ; calcolarne le corrispon- denti stime. (b)Determinare l'estremo superiore dial 95% di condenza. Sulla base del risultato ottenuto, si può aermare a livello 5% che il sospetto dell'azienda 2sia fondato? Per rispondere, impostare un opportuno test di livello = 1%, avendo cura di specicare ipotesi nulla, ipotesi alternativa e regola di decisione. Soluzione(a)La media campionaria vale x=P 100 i=1x i100 = 50 :174 mentre, per la varianza campionaria risulta s2 X=P 100 i=1( x i  x)299 =P 100 i=1x2 i 100 x299 = 252150 :010050:174299 = 406 :972499 ' 4:1108 (b)Poiché il campione è gaussiano, l'estremo superiore didi condenza1 = 0:95è  x+t (99)s Xp 100 ' 50:174 + 1:645p4 :1108p 100 ' 50:5075 Pertanto, siamo condenti al 95% circa chesia minore di50:5076. Per stabilire se il sospetto dell'azienda susia fondato, osserviamo che 0= 50 ml 22 , nel caso di un campione casuale gaussiano con media incognita. La statistica test è 99S2 X2 2' 101:7423 da confrontare con il quantile2 0:01(99) 'p198 z 0:01+ 99 'p198 2:33 + 99'131:786(oppure 2 0:01(100) = 135 :81): non riutiamoH 0a livello 1%poiché101:74230tale cheF T( t)6 = 1: Risulta quindi(t) =ddt ln(1 F T( t)) da cui Z t 0 (u)du= ln(1F T( t))ln(1F T(0)) = ln(1 F T( t))0 inne FT( t) =( 0pert0 1eR t 0 (u)du pert >0 (b)F T(3) = 1 eR 3 0(0 :2+0:8u)du = 1e 30:20:84:5 = 1e 4:2 '0:9850D 2 (a)Denire la covarianzaCov(X; Y)di due variabili aleatorieXeY. Fornirne le principali proprietà e dimostrarne almeno una signicativa. (b)CalcolareCov(2X+ 3Y3; Y)se E(X) = 1;E(Y) =2;E(Y2 ) = 5;E(X Y) = 0:5 Soluzione 1 (a)Siano XeYdue v.a. che ammettono varianza nita. Si denisce covarianza diXeYil numero Cov(X; Y) = E[(XE(X))(YE(Y))] Valgono le sequenti proprietà:ˆCov(X; Y) = Cov(Y ; X)eCov(X; X) = Var(X); ˆCov(X; a) = 0per ognia2R; ˆCov(aX; Y) =aCov(X; Y)per ognia2R; ˆCov(X+Z; Y) = Cov(X; Y) + Cov(Z; Y)per ogniZche ammette varianza; ˆCov(X; Y) = E(X Y)E(X) E(Y); ˆSeXeYsono indipendenti alloraCov(X; Y) = 0. La dimostrazione di ciascuna delle proprietà elencate segue immediatamente dalle proprietà del valore atteso, per esempio . . . (Cfr. Denizione 4.8.1 e Proposizione 4.8.2 pagina 96 degli Appunti di calcolo delle probabilità di Epifani, Ladelli, Posta, AA 2019/20.) (b) Cov(2X+ 3Y3; Y) = 2 Cov(X; Y) + 3 Var(Y)Cov(3; Y) = 2[E(X Y)E(X) E(Y)] + 3[E(Y2 )(E(Y))2 ]0 = 2[0:51(2)] + 3[5(2)2 ] = 8D 3 SiaX 1; : : : ; X nun campione aleatorio estratto dalla popolazione f #con #2parametro unidi- mensionale incognito. (a)Dare la denizione di intervallo bilatero di condenza1 per#e di quantità pivotale. (b)Partendo ora dalla quantità pivotale2nX n#  2 (2n) costruire un intervallo bilatero di condenza95%per#e la relativa stima intervallare sen= 3eX n= 1 :8. Soluzione(a)SianoT 1= t 1( X 1; : : : ; X n) eT 2= t 2( X 1; : : : ; X n) due statistiche tali cheT 1< T 2e per le quali P#( T 1< # < T 2) = 1 8#2 Alloraˆ(T 1; T 2) è detto intervallo di condenza all'(1 )100%per#; ˆ1 è detto livello di condenza. Una quantità pivotale è una funzione del campione e del parametro incognitoQ(X 1; : : : X n; #)la cui distribuzione è completamente specicata. (b)Data la quantità pivotaleQ(X 1; : : : X n; #) =2 nX n# vale 0:95 =P # 2 0:975;2n t 0:1;6' 1:44 quindi si riutaH 0al 10%: si può ritenere che le viti di tipo X soddisno la richiesta di resistenza media superiore a300 N=mm2 . (b)Uno stimatore non distorto della comune varianza è la varianza pooled S2 p=S 2 X( n1) +S2 Y( m1)n +m2 Inserendo i dati del problema si has2 p= 27 :37538. (c)Se aermando che le viti di tipo X sono mediamente meno resistenti alla trazione di quelle di tipoY si sta commettendo un errore di I tipo, allora questa tesi va assunta come ipotesi alternativaH 1 e il suo contrario come ipotesi nullaH 0. Si ha quindi da vericare il problema H0:  X  Ycontro H 1:  X<  Y e una regola di decisione di livello è riutareH 0se  t0:= x n  y ms pq1 n +1m  t ;n+m2 Usando i dati forniti e i risultati del punto (b), la statistica test vale t0' 1:158. Poiché dalle tavole risultat 0:10;13' 1:350