Michal Gancarski ist seit über 4 Jahren als Data Engineer bei Zalando beschäftigt. Insgesamt ist er seit über sieben Jahren als Software-/ Data Engineer tätig und sammelte Erfahrungen sowohl in Start-ups als auch in größeren Unternehmen. Er arbeitet seit 2016 bei Zalando und hat am Aufbau einiger der Kernkomponenten des Data Lake und zusätzlicher Services des Unternehmens mitgewirkt. Zu den Schwerpunkten in seiner aktuellen Rolle gehören: Data Pipelines, aufgebaut mittels verschiedener Stacks (Luigi, AWS Lambda, SQS and Step Functions, Databricks Spark), DataOps und Integrationscode für Processing Komponenten des Zalando Data Lake (Presto, Hive, Databricks Spark), Metadaten-Management mit Schemainferenzen, Erkennung von Schemakonflikten und Maintenance von Zugriffstabellen und -Ansichten (Python), sowie REST API für Datenanalyse mit konfigurierbaren Datensätzen, Attributen, Metriken und Abfragen (Python, Celery).