Apache Airflow - фреймворк для построения и мониторинга процессов работы с большими данными, а также управления ими.
Как и многие другие инструменты в области Big Data, Airflow предоставляет web-interface для работы с системой.
Big Data Tools - это семейство плагинов платформы IntelliJ для комфортной работы с большими данными в рамках IDE.
Одна из основных идей Big Data Tools - интеграция ключевых инструментов внутри IDE для сокращения затрат ресурсов разработчика на переключение контекстов.
Цель проекта - обеспечить возможность проводить большую часть работы с Airflow, не покидая IDE, а также повысить удобство этой работы средствами платформы IntelliJ.
В рамках стажировки предстоит провести интеграцию Airflow и Big Data Tools:
При работе над проектом будет возможность ознакомиться с рядом технологий:
и просто получить хорошее общее представление о том, как архитектурно выглядит мир обработки больших данных.