BIG DATA: Analisi Efficace dei Dati con Tecniche Statistiche

bt_bb_section_bottom_section_coverage_image
Destinatari

 Imprenditori
 Direzione Operativa
 Direzione Tecnica
 Direzione Commerciale e Marketing
 Direzione Qualità

Obiettivi

Il corso si pone l’obiettivo di fornire al Management le conoscenze per sviluppare ed usare un
sistema Big Data, orientato agli obiettivi Aziendali, cioè un sistema capace di RISPONDERE alle
domande del Management
Fornisce quindi gli strumenti al Management perché possa individuare COSA POTER OTTENERE
da un sistema BIG DATA, cioè le risposte che le diverse tecniche di analisi possono fornire.
La conoscenza operativa dei tools informatici e statistici è parte di un know-how specialistico dei
Data Scientist, di cui il Management deve apprendere comunque i principi, per evitare di costruire
un sistema inutile e scollegato dagli OBIETTIVI AZIENDALI.
In sintesi, gli obiettivi sono:
 Come progettare un sistema decisionale basato sui Big Data secondo il metodo SIX SIGMA
(DMAIC).
 Creare le competenze su come utilizzare un sistema basato sui BIG DATA, per PRENDERE
DECISIONI
 Quali informazioni si possono ottenere con gli strumenti avanzati di statistica applicati ai BIG
DATA

Contenuti

OBIETTIVO ARGOMENTO
STRUTTURA BIG DATA
Presentare la struttura di gestione dei Big Data
I Big DATA e il modello 3V
La struttura di un sistema Big Data
Big Data e Industry 4.0.
Gli attori dei Big DATA
DEFINE:
la scelta della struttura Big Data dipende dagli
obiettivi e dalla strategia aziendale definita dal Top
Management.
in questa fase si definiscono le informazioni che il
sistema Big Data dovrà fornire al management
Definizione degli output e delle fonti
di input
Tipologia dei dati (non strutturati,
strutturati)
Dati quantitativi e qualitativi
MEASURE:
la definizione della qualità delle fonti di
informazione, non è un concetto assoluto, ma
dipende dagli output attesi.
La qualità del dato non è solo un fatto tecnico, ma
spesso dipende dalla struttura organizzativa, quindi i
limiti di qualità dei dati devono essere noti al
Management e gestiti.
Qualità del dato
L’analisi descrittiva. I motori OLAP
ANALYZE:
il Management deve conoscere le basi delle
analisi statistiche per poter valutare i risultati
presentati dai Data Scientist
Ogni ipotesi statistica è accompagnata dalla
valutazione del rischio di errore (alpha e beta).
Il Management deve definire le soglie di rischio
(confidenza) in funzione degli obiettivi.
Statistica Descrittiva
media, varianza, distribuzione
istogramma
boxplot
Rischio alpha e beta
Test delle ipotesi (1 t target)
p-value
Test ipotesi (2 medie)
Anova
Normality plot
IMPROVE:
in questa fase si USANO i risultati per fare
PREVISIONI e fare scelte.
I modelli previsionali devono essere affiancati dalla
definizione delle FUNZIONI COSTO, i cui parametri
sono legati agli obiettivi aziendali.
Il Management deve utilizzare le previsioni fornite
dai modelli per definire soluzioni economiche
ottimali.
Quindi si deve OTTIMIZZARE LA FUNZIONE
COSTO, non la soluzione tecnica
La trasformazione dei dati: PCA e
analisi fattoriale
le funzione costo (Loss function
TAGUCHI)
La regressione e le sue misure: R
quadro e p value
Il problema dell’ overfitting dei modelli
predittivi BIAS_VARIANZA
La regressione logistica e le sue misure
Le tabelle di contingenza e il test chi quadro
Altri modelli predittivi: SVM, Alberi decisionali, Random Forest
CONTROL: tutte le condizioni al contorno mutano nel tempo,
quindi è necessario che venga pianificata ed
La valutazione dei modelli predittivi eseguita una rivalutazione periodica degli output
forniti dal Sistema Big Data, dei modelli, dei dati ingresso.

Prerequisiti

Nessuno

Durata

16 ore

Quotazione

€ 850