Running Spark

Pipelines d’anprendiment automàtich ansima a Kubernetes

Running Spark
Oget Sys
Èira dij resior ëd sistem
Andoa Stansia Sys
@ Toolbox Coworking
Contrà Agostino da Montefeltro 2, Turin
Quand 23 di fa
26/10/2019 ora 16:00
Dëscaria ël memo dël calendari
Lenga Italiano

Abstract/Sintes

Se miraco i l'eve sentù parlé ëd "calcul spantià", adess iv lo foma vëdde, e as dësmora nen.

Descrission

Apache Spark a l'é un framework open source për l'elaborassion dij big data con API për Scala, Python e Java. A parte da la version 2.3 a l'han gionta-je la possibilità ëd fe vire cluster Spark ansima Kubernetes

Delta Lake a l'é në storage layer fait an sors duverta da Databricks nel 2019 che a përmet ëd dovré transassion ACID ansima ëd tabele creà da Spark. A peul dovré an tant che backend un filesystem comsëssia compatibil con Hadoop e j'object storage pì spantià an sël mercà.

Info

La presentassion a sarà nen mach an sla part infrastrutural e sistemistica (configurassion ëd Kubernetes, pod necessari, configurassion Spark), ma ëdcò e dzortut an sla manera dë scrive an codes Spark për nen sgairé le potenssialità dla solussion.

Armarche

Ël logh d'Apache Spark a l'é distribuvù con licensa Apache 2.0 da Wikimedia Commons.

Presentador

Anans a-i ven

Dësgagé le query con Dremio

Apress a-i ven

MQTT

Va andarera al Linux Day Turin