Конвейєри оброблення даних керують потоком даних із моменту їх початкового збирання до консолідації, очищення, аналізу, візуалізації й багато чого іншого. Apache Airflow надає єдину платформу, яку можна використовувати для проєктування, реалізації, моніторингу
та обслуговування конвеєрів. Простота користувацького інтерфейсу, можливості plug-and-play і гнучкі сценарії
Python оптимізують вирішення будь-яких завдань, що стосуються керування даними.
Ця книга навчить вас створювати та супроводжувати ефективні конвеєри обробки даних. Вивчіть найпоширеніші моделі їхнього використання, особливості орієнтованих ациклічних графів (ОАГ), які забезпечують роботу Airflow, а також способи їх настроювання відповідно до потреб вашого конвеєра.
Видання призначене для фахівців з DevOps, оброблення та зберігання даних, машинного навчання, а також системних адміністраторів із навичками програмування на Python.