BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//ldto/asd//NONSGML v1.0//EN
CALSCALE:GREGORIAN
BEGIN:VEVENT
UID:2019-235@linuxdaytorino.org
SUMMARY:Running Spark
DESCRIPTION:[Apache Spark]( http://spark.apache.org/) è un framework open source per l'elaborazione dei big data con API per Scala, Python e Java. Dalla versione 2.3 è stata introdotta la possibilità di eseguire cluster Spark su Kubernetes  [Delta Lake](https://docs.delta.io/) è uno storage layer reso open source da Databricks nel 2019, che permette di utilizzare transazioni ACID su tabelle create da Spark. Può utilizzare come backend qualunque filesystem compatibile con Hadoop e i principali object storage presenti sul mercato  [Info](https://databricks.com/blog/2019/04/24/open-sourcing-delta-lake.html)  Il talk verterà non solo sulla parte infrastrutturale e sistemistica (configurazione di Kubernetes, pod necessari, configurazioni Spark), ma anche e soprattutto su come scrivere codice Spark per sfruttare le potenzialità della soluzione.
URL;VALUE=URI:https://linuxdaytorino.org/2019/talk/apache-spark?l=it
GEO:45.0503;7.66913
DTSTART:20191026T160000Z
DTEND:20191026T170000Z
DTSTAMP:20260430T195516Z
END:VEVENT
END:VCALENDAR