Требования на должность Дата-инженера:- Опыт работы с большими данными: Hadoop, Spark, Kafka.
- Знание алгоритмов и структур данных.
- Отличное знание SQL и Python, Java/Scala.
- Опыт работы с облачными платформами, в частности Amazon Web Services.
- Хорошее понимание баз данных SQL и NoSQL (моделирование данных, хранение данных).
- Понимание основ распределенных систем.
- Опыт работы с инструментами визуализации данных, такими как Tableau или ElasticSearch.
Дата-инженеры являются специалистами в области разработки программного обеспечения и бекенда. Если компания начинает генерировать большой объем данных из разных источников, задача дата-инженера состоит в том, чтобы организовать сбор информации, ее обработку и хранение.
Дата-продукт – это результат трансформации данных в качественную информацию, которая приносит пользу бизнесу. Является ли дата-инженер более востребованным, чем дата-саентист? Без него/нее ценность модели-прототипа, чаще всего состоящей из фрагмента кода ужасного качества в файле Python, полученной от дата-саентиста и каким-то образом дающей результат, стремится к нулю.
Без дата-инженера этот код никогда не станет проектом, и никакая бизнес-проблема не будет эффективно решена.