Speed up your ETL with Pandas UDFs in PySpark

Veröffentlicht am 19.6.2020
So beschleunigen Sie ETL-Prozesse durch den Einsatz von Pandas UDFs in PySpark auf EMR Clustern in der Amazon Cloud

Mehr lesen


Vom Numbercruncher zum Data Scientist – die neuen Controller

Veröffentlicht am 11.5.2020
Die Aufgaben des Controllers verändern sich Gartenparty. In Ihrem Glas klackern Eiswürfel, die Luft ist mild, die Stimmung...

Mehr lesen


Transformation vom legacy Datawarehouse hin zur modernen Cloud Datenplattform

Veröffentlicht am 21.1.2020
  Mit unseren Kunden haben wir die Reise vom traditionellen Data Warehouse bspw. in die Amazon Cloud schon öfter angetreten....

Mehr lesen