Data Quality e Big Data
- Durata corso: 2gg
STRUTTURA DEL CORSO
- Introduzione ai concetti di qualità dei dati
- Da ETL tradizionali (presentazione dei principali framework) a ETL con tecnologie Big Data
- Introduzione a Spark
- Introduzione a Scala
- Caso d'uso: creazione di una pipeline di trattamento e pulizia di dati (ETL) con Spark e MongoDB