Как мы помогли клиенту нанять 14 data-инженеров, дообучив кандидатов Apache Spark

Задача
Заказчику необходимо увеличить процент найма data-инженеров, владеющих редкими навыками работы с Apache Spark.
Решение
Запустили программу обучения соискателей на этапе отбора. В результате увеличили процент найма с 0,5% до 23%.

Задача

Заказчик регулярно нанимает data-инженеров, но из 200 кандидатов на вакансию до оффера доходил только 1 — то есть процент найма составлял 0,5%. Нам необходимо было кратно и быстро его увеличить, «подтянув» тех соискателей, которым не хватало только навыков работы с Apache Spark.

Решение

Первым шагом мы провели широкий скрининг резюме по открытым позициям заказчика — отсмотрели порядка 1200 профилей — и выявили среди них 600 кандидатов, которые подходили и сразу для собеседований на открытые позиции, и для быстрого дообучения Apache Spark. Среди отобранных кандидатов провели тестирование — после него у нас осталось 148 человек, которые вошли в группы по дообучению.

Как мы выбирали кандидатов

Мы выбирали тех, кто уже хорошо знаком с SQL, Python, знает основы Data Lake/DWH — отбирали не вручную, а с помощью автоматизированного тестирования. В нем кандидату предлагалось пройти тест с вариантами ответов, по итогам которого он сразу видел свои баллы по всем требуемым для найма компетенциям. Если тестируемый не достигал проходного уровня по всем компетенциям, система показывала его уровень и рекомендации по улучшению проседающих навыков, а если тест был пройден достаточно хорошо, то открывалось второе задание — уже без вариантов решений.
Решения этих заданий мы уже изучали вручную и либо приглашали на программу обучения, либо, если у кандидата хватало всех компетенций, в том числе Apache Spark, передавали его контакты клиенту для приглашения на собеседование.

Как проходило обучение

В течение месяца участники прошли 8 двухчасовых вебинаров. По итогам каждого выполняли домашнюю работу, основанную на реальных задачах заказчика, которую проверял и оценивал эксперт. Диапазон заданий был широким: от визуализации данных с динамическими параметрами в Zeppelin и работы с RDD до поднятия кластера и UDF оптимизации. Для этих заданий у нас была развернута инфраструктура на Т1 Облаке — в целях безопасности все учились в закрытом контуре через VPN.

Решение

60 человек успешно освоили курс, и мы передали их полное портфолио с ранжированием по баллам нанимающим менеджерам клиента. Оно включало резюме, результаты тестирований, успеваемость, обратную связь от эксперта, примеры работ и кода.
Половину выпускников пригласили на интервью, 14 человек в итоге получили оффер — а это уже 23% найма по сравнению с начальными 0,5%. Весь путь занял месяц.
В области Data Science есть множество инструментов, библиотек, фреймворков, видов баз данных и так далее — и поэтому найти специалиста с конкретными точечными навыками, подходящими именно вашей компании, бывает достаточно трудно, долго и дорого.
Точечное дообучение кандидатов на реальных задачах — это актуальный вариант найма в ИТ. Кандидаты начинают вливаться в процессы и узнают многое о компании, задачах и инструментах еще до трудоустройства. Это позволяет сократить время на онбординг и адаптацию.