logo
  • userLoginStatus

Welcome

Our website is made possible by displaying online advertisements to our visitors.
Please disable your ad blocker to continue.

Current View

Management Engineering - Business Data Analytics

Full exam

Quesiti Parte A Quesito 1 ▪ Si vuole valutare l’efficacia di un finanziamento statale alle imprese del settore dei trasporti ritenute più in difficoltà a seguito dello scoppio della pandemia da Covid -19 . ▪ Pertanto , viene selezionato un campione di 260 imprese di autotrasporti , le quali sono suddivise in due gruppi :trattati e non trattati . ▪ Le imprese trattate sono quelle che , nell’anno 2020 , hanno registrato un rapporto tra fatturato e fatturato medio delle imprese che operano nello stesso settore inferiore ad un certo cut -off . ▪ La variabile di assegnazione è indicata con x. ▪ Per valutare l’efficacia del trattamento , si valuti l’impatto che esso ha generato sul fatturato del 2021 (variabile y) , confrontando le imprese trattate con quelle non trattate . Quesito 1 ▪ Sulla base del seguente output di R, indicare le risposte corrette : rdd_model = rdrobust(y, x, c=0.7, p=2, kernel='epanechnikov') summary(rdd_model) Quesito 1 ▪ Il kernel utilizzato nella regressione è di tipo “uniform” ▪ Poiché l’effetto del trattamento è negativo ,le imprese a cui viene assegnato il trattamento registrano un decremento del proprio fatturato del 73 .1 % nel 2021 ▪ Il valore del cut -off è pari al 50 % ▪ Per la stima dell’impatto del programma , la Regressione Discontinua utilizza meno della metà delle osservazioni del dataset ▪ Nessuna delle risposte precedenti Quesito 1 ▪ Il kernel utilizzato nella regressione è di tipo “uniform” . − FALSO, il kernel è di tipo “Epanechnikov” . ▪ Poiché l’effetto del trattamento è negativo, le imprese a cui viene assegnato il trattamento registrano un peggioramento del proprio fatturato del 73 .1% nel 2021 . − FALSO, in questo caso, un effetto del trattamento negativo indica un incremento del fatturato del 73 .1% da parte delle imprese trattate (tale valore però non è statisticamente significativo) . ▪ Il valore del cut -off è pari al 50 % . − FALSO, il cut -off è pari a 70 % . ▪ Per la stima dell’impatto del programma, la Regressione Discontinua utilizza meno della metà delle osservazioni del dataset . − VERO, sono utilizzate 67 osservazioni (25 +42 )su 260 totali, ossia circa il 26 % . ▪ Nessuna delle risposte precedenti . − FALSO, in quanto la 4 è vera Quesito 2 6 Si supponga di avere a disposizione i dati contenuti nella seguente tabella . Considerare che la porzione di popolazione non trattata è pari a 0 .7 e la porzione di popolazione trattata è pari a 0 .3 .Selezionare le affermazioni corrette : La tabella contiene i valori della variabile outcome Gruppo Non Trattato Gruppo Trattato Outcome senza trattamento 4 7 Outcome con trattamento 8 12 1. La differenza tra ATT (A verage Treatment Effect on Treated) ed ATU (Average Treatment Effect on Untreated) è inferiore a 3 . 2. L’Average Treatment Effect (ATE) è pari a 4 ,8 . 3. L’ATT è maggiore del Naive Estimator (NE) . 4. Il Naive Estimator è pari a 4 . 5. Nessuna delle altre risposte è corretta . Quesito 2 7 ➢ NE = E(Y 1 |D= 1 ) – E(Y 0 |D= 0 ) = 12 – 4 = 8 ➢ ATT = E(Y 1 |D= 1 ) – E(Y 0 |D= 1 ) = 12 – 7 = 5 ➢ ATU = E(Y 1 |D= 0 ) − E(Y 0 |D= 0 ) = 8 - 4 = 4 ➢ ATE = µATT + (1 − µ)ATU= 0 ,3 *5 + 0 ,7 *4 = 4 ,3 . µ è la percentuale della popolazione trattata Conseguentemente : 1. La differenza tra ATT (Average Treatment on Treated) ed ATU (Average Treatment Effect on Untreated) è inferiore a 3 . ⚫ VERO, la differenza è pari a ATT – ATU = 5 – 4 = 1 < 3 . 2. L’Average Treatment Effect (ATE) è pari a 4 ,8 . ⚫ FALSO .ATE = 4 ,3 . 3. L’ATT è maggiore del Naive Estimator (NE) . ⚫ FALSO, ATT = 5 < NE = 8 . 4. Il Naive Estimator è pari a 4 . ⚫ FALSO, NE = 8 . 5. Nessuna delle altre risposte è corretta . ⚫ FALSO, in quanto la 1 .è vera . Quesito 3 8 Considerando la rete riportata in figura si individui quali tra le seguenti affermazioni sono vere : Quesito 3 1. Il nodo 4 ha un grado pari a 5 che è il massimo della rete . 2. Vi sono due nodi con grado in entrata pari a 0 . 3. Non vi sono cammini più corti che partono dal nodo 2 o dal nodo 4 . 4. La lunghezza del cammino più corto tra il nodo 3 e il nodo 6 è 5 . 5. Il nodo 2 fa parte di 3 triangoli, ma ha un clustering coefficient inferiore a quello del nodo 8 se si considera la rete nella sua forma non diretta . 6. Tutte le risposte sono false Quesito 3 1. Il nodo 4 ha un grado pari a 5 che è il massimo della rete . ▪ FALSO .Il nodo 4 ha grado pari a 6 perché il link col nodo 1 si conta due volte . 2. Vi sono due nodi con grado in entrata pari a 0. ▪ FALSO .Solo il nodo 3 non ha link in entrata . 3. Non vi sono cammini più corti che partono dal nodo 2 o dal nodo 4. ▪ FALSO .Idue nodi hanno almeno un link in uscita 4. La lunghezza del cammino più corto tra il nodo 3 e il nodo 6 è 5 ▪ VERO .È il cammino 3->2->8->4->1->6 5. Il nodo 2 fa parte di 3 triangoli ma ha un clustering coefficient inferiore a quello del nodo 8 se si considera la rete nella sua forma non diretta ▪ VERO .Il nodo 2 fa parte dei triangoli 2-5-4 | 2-5-6 | 2-8-4 |.Il nodo 8 invece fa parte solo di quest’ultimo triangolo . Per calcolare il clustering coefficient si calcola la frazione di triangoli di cui fa parte il nodo rispetto a tutti i triangoli costruibili fra isuoi link . Dal momento che tutti ilink del nodo 8 fanno parte di triangoli il suo CC è 1,al contrario il nodo 2 ha link tra coppie di nodi a loro volta non connessi (ad esempio inodi 3 e 6)e quindi il suo CC è inferiore a 1 6. Tutte le risposte sono false . ▪ FALSO . Quesito 4 11 La distribuzione del grado della rete g è stata approssimata con due modelli, m 1 ed m 2 , plottati a sinistra . Si riportano a destra iparametri e irisultati dei test sul fitting dei modelli .Indicare le risposte corrette tra le seguenti : Quesito 4 ▪ Se il modello m 1 fosse un modello di power law , allora avrebbe un esponente pari a 9 .431397 ▪ Il secondo test (compare_distributions (m 1 , m 2 )$ p_one_sided ) non rifiuta l’ipotesi nulla che il modello 1 non sia migliore del modello 2 nello spiegare i dati . ▪ I tre test considerati assieme indicano che il modello 1 è il più adatto a modellare idati . ▪ Tutte le risposte sono false . Quesito 4 ▪ Se il modello m 1 fosse un modello di power law , allora avrebbe un esponente pari a 9 .431397 ▪ VERO ▪ Il secondo test (compare_distributions (m 1 , m 2 )$ p_one_sided ) non rifiuta l’ipotesi nulla che il modello 1 non sia migliore del modello 2 nello spiegare i dati . ▪ VERO . Il p -value del test è molto alto quindi non si può rifiutare l’ipotesi nulla . ▪ I tre test considerati assieme indicano che il modello 1 è il più adatto a modellare idati . ▪ FALSO .Indicano che il modello 2 è il migliore . ▪ Tutte le risposte sono false . ▪ FALSO . Quesito 5 ⚫ Sapendo che : ⚫ la sensitivity di un classificatore è pari al 20 % ⚫ la sua specificity è pari all’ 80 % ⚫ nel dataset sono presenti 500 osservazioni positive ⚫ nel dataset sono presenti 200 osservazioni negative ⚫ Si calcoli l’accuracy e la precision del classificatore . Quesito 5: Soluzione P