logo
Management Engineering - Business Data Analytics

Business Data Analys


Synthetic program:

MODULO I

MOOC di livellamento
- Introduzione a R
- Esplorazione grafica e analisi descrittiva per dati univariati Introduzione allo statistical learning
- Inferenza (test) per due popolazioni. One way and two way ANOVA per dati univariate
- Analisi multivariate: esplorazione, quantificazione della dipendenza (matrice di varianza/covarianza)
- Riduzione dimensionale: Analisi delle Componenti Principali, Analisi Discriminante Canonica di Fisher

2) Modelli Lineari (Generalizzati)
- Regressione lineare semplice e multipla. Stima dei coefficienti, valutazione dell’accuratezza della stima dei coefficienti, valutazione dell’accuratezza del modello. Predittori qualitativi. PRESS.
- Selezione del modello e regolarizzazione: subset selection, metodi di shrinkage (ridge regression e lasso).
- Regressione logistica (binaria and multinomiale). Sensitività, Specificità, Curva ROC

3) Regressione non parametrica, classificazione e clustering
- Regressione e classificazione supervisionata: LDA, KNN, CART, Random Forest.
- Classificazione non supervisionata. Clustering gerarchico e K-means
- Cross Validazione

MODULO II

Introduzione ai metodi causali per l’inferenza statistica applicata all’economia e al management.
- Teoria degli studi controllati randomizzati
- Metodi per l’identificazione e la stima degli effetti causali
- Regression discontinuity design
- Diff-in-diff
- Variabili strumentali

Introduzione alla teoria dei network, con particolare riferimento agli ambiti di management, organizzazione e per lo studio delle reti tra imprese e dei fattori d’instabilità nei sistemi economici, industriali e finanziari:
- Definizione concettuale ed algebrica di un network
- Misure globali e locali
- Algoritmi di centralità
- Clustering, community detection, struttura core-periphery

Classificazione e clustering in management science:
- Segmentazione di cliente e prodotto
- Churn analytics

Crescita delle imprese e analisi dei dati di struttura e dinamica industriale:
- Analisi di crescita, volatilità, dimensione delle imprese, innovazione, turnover, composizione del portafogli prodotti
- Presentazione delle distribuzioni più note e controllo dei parametri rilevanti, cosa significa fare fitting di una distribuzione, metodi e test per valutare se i dati provengono da una certa distribuzione (KS test), confronto di distribuzioni. Sviluppo di analisi simulative e di esercizi di forecasting.

Laboratorio con software R per la statistica computazionale e la rappresentazione grafica (liberamente scaricabile da www.r-project.org).

Lecture Notes

Complete course:

Type File name Year
Handwritten notes Complete course notes - Part 1 2020/2021
Digital notes Complete course notes - Part 2 2020/2021
Digital notes Completed notes of the course - Part 2 2020/2021
Handwritten notes Complete course notes 2018/2019

Divided by topic:

Type File name Year
File not available...

Other:

Type File name Year
File not available...

Exercises

Complete course:

Type File name Year
File not available...

Divided by topic:

Type File name Year
File not available...

Other:

Type File name Year
File not available...

Exams

First partial exam:

Type Date
File not available...

Second partial exam:

Type Date
File not available...

Full exam:

Type Date
Text and solution 06/09/2022
Text and solution 18/07/2022
Text and solution 27/06/2022
Text and solution 09/09/2021
Text and solution 19/07/2021
Text 28/06/2021
Solution 28/06/2021

Oral exam:

Type Date
File not available...

Multiple choice test:

Type Date
Text and solution 01/07/2022

Other:

File name
File not available...

Other

Laboratory:

File name Year
Laboratory 2018/2019
Laboraty of R - complete notes 2018/2019

Projects:

File name Year
File not available...

Presentations:

File name Year
File not available...

Collections of notes, exercises or exams:

File name Year
File not available...

Tables:

File name Year
File not available...

Etc:

Live

Quick daily notes, exercises and audio recordings. Files will be approved on priority but deleted after 365 days. 2 points will be assigned by default.

Quick contents:

File name Date
File not available...