Вакансия: Data Engineer в Москва

Полное описание вакансии: Data Engineer в Москва

ID Название вакансии Город Компания От До Валюта Тип вакансии Дата и время публикации вакансии Роль
1068165 Data Engineer Москва > Fplus open 2024-02-13
Необходимые навыки
  • > Python
  • > SQL
  • > Базы данных
  • > ClickHouse
  • > DWH
  • > Greenplum
  • > ETL
  • > StreamLit
  • > Data Engineer
  • > Luxms
  • > Data Lake
Обязанности

Управлять инструментами интеграции и контроля качества данных. Проводить нетиповые интеграции. Участвовать в формировании архитектурных паттернов интеграции данных. Холдинг Fplus запускает...

Описание

Команда М-Тех, входящая в ИТ-холдинг Fplus, ищет кандидата на должность «Инженера данных».

Холдинг Fplus входит в Toп 3 российских ИТ-компаний и занимается производством смартфонов, серверов, планшетов, персональных компьютеров, систем хранения данных под собственным брендом, дистрибуцией оборудования, а также развивает розничную сеть «Всесмарт».

Мы предлагаем:

  • Трудоустройство в соответствии с ТК РФ в аккредитованное ЮЛ холдинга;
  • Работу в комфортном современном офисе;
  • График работы: 5/2 с 9.30 до 18.30;
  • Возможности профессионального развития;
  • ДМС и программу лояльности для сотрудников;
  • Спортивные мероприятия, экскурсии, мастер-классы;
  • Корпоративное обучение, вебинары и тренинги.

Холдинг Fplus запускает проект централизации функций управления корпоративными данными. В рамках данной активности формируется новая команда Data Office. Перед командой стоит цель построить новую экосистему аналитических инструментов.

Чем предстоит заниматься:

  • Разработкой и оптимизацией облачного хранилища данных (Data Warehouse);

  • Управлять инструментами интеграции и контроля качества данных;

  • Проводить нетиповые интеграции;

  • Внедрять практики и инструменты контроля и поддержания качества данных;

  • Помогать аналитикам в сложных алгоритмах, требующих оптимизации.

Сейчас в работе:

  • Создание хранилища данных на MPP-платформе Greenplum и ClickHouse;
  • Внедрение self-service продуктов анализа данных Luxms и StreamLit;
  • Формирование базы знаний о данных Data Catalog.

Также у команды есть прикладные задачи по внедрению Campaign (рассылки, акции, ссылки) системы и Loyalty движка (бонусная программа), и дополнительно внедрение NLP и GPT алгоритмов для работы со справочниками и документами.

Сейчас стартовала фаза пилотов и готовится защита целевой архитектуры. Идёт инсталляция инфраструктуры, начинается развёртывание систем.

В основе новой стратегии работы с данными стоит принцип self-service, что значительно повышает доступность данных для бизнеса и минимизирует рутинные функции на стороне ИТ.

Наши ожидания:

  • Отличные знания SQL: оптимизация запросов, понимание планов запроса, внутренней работы SQL (оптимизация запросов, hash join, nested loop, типы индексов и т.п.);

  • Уверенное знание Python: написание API, небольших скриптов и сервисов;

  • Понимание ETL-оркестраторов: Airflow;

  • Понимание концепции хранилищ данных (DWH, Data Lake): слои, витрины, агрегаты;

  • Инфраструктурные инструменты: Docker, CI/CD.

Вверх