Старший инженер по машинному обучению — Оценка LLM / Создание задач (Местонахождение: Индия)
💡 Совет по отклику: Нажав «Откликнуться на Mercor бесплатно», вы перейдете на официальный сайт Mercor. Это на 100% бесплатно для вас и помогает поддерживать нашу платформу за счет реферальных бонусов.
⚠️ Примечание о переводе: Информация о вакансии переведена с помощью ИИ. При неточностях или неоднозначностях ориентируйтесь на оригинал на английском.
Обзор роли
Mercor ведет набор для ведущей исследовательской лаборатории ИИ, чтобы привлечь высококвалифицированных инженеров по машинному обучению с подтвержденным опытом создания, обучения и оценки высокопроизводительных систем машинного обучения в реальных условиях. На этой должности вы будете разрабатывать, внедрять и курировать высококачественные наборы данных, задачи и рабочие процессы оценки для машинного обучения, которые обеспечивают обучение и бенчмаркинг передовых систем ИИ.
Эта позиция идеально подходит для инженеров, которые преуспели в соревновательном машинном обучении, например, на Kaggle, обладают глубокой интуицией в моделировании и способны преобразовывать сложные реальные проблемы в надежные, хорошо структурированные конвейеры и наборы данных машинного обучения. Вы будете тесно сотрудничать с исследователями и инженерами для разработки реалистичных проблем машинного обучения, обеспечения качества наборов данных и проведения воспроизводимых, высокоэффективных экспериментов.
Кандидаты должны иметь 3–5+ лет опыта прикладного машинного обучения или значительные достижения в соревновательном машинном обучении, а также проживать в Индии. Идеальные кандидаты свободно владеют Python, имеют опыт создания воспроизводимых конвейеров и знакомы с фреймворками для бенчмаркинга, методологиями оценки и лучшими практиками оценки моделей машинного обучения.
Обязанности
- Формулировать уникальные проблемы машинного обучения для улучшения возможностей LLM.
- Разрабатывать, создавать и оптимизировать модели машинного обучения для задач классификации, прогнозирования, обработки естественного языка (NLP), рекомендаций или генеративных задач.
- Проводить быстрые циклы экспериментов, оценивать производительность моделей и постоянно итерировать.
- Выполнять продвинутую разработку признаков и предварительную обработку данных.
- Внедрять состязательное тестирование, проверки устойчивости моделей и оценки предвзятости.
- Дообучать, оценивать и развертывать модели на основе трансформеров при необходимости.
- Вести четкую документацию по наборам данных, экспериментам и решениям по моделям.
- Быть в курсе последних исследований, инструментов и методов машинного обучения для продвижения возможностей моделирования.
Требуемая квалификация
- Не менее 3–5 лет полного рабочего дня в разработке моделей машинного обучения
- Техническое образование в области компьютерных наук, электротехники, статистики, математики или смежной области
- Подтвержденный опыт в соревновательном машинном обучении (Kaggle, DrivenData или аналогичные платформы)
- Доказательства высококлассных результатов в соревнованиях по машинному обучению (медали Kaggle, выход в финал, высокие места в таблице лидеров)
- Уверенное владение Python, PyTorch/TensorFlow и современными фреймворками ML/NLP
- Глубокое понимание основ машинного обучения: статистика, оптимизация, оценка моделей, архитектуры
- Опыт работы с распределенным обучением, конвейерами машинного обучения и отслеживанием экспериментов
- Сильные навыки решения проблем и алгоритмическое мышление
- Опыт работы с облачными средами (AWS/GCP/Azure)
- Исключительные аналитические, коммуникативные и межличностные навыки
- Способность четко объяснять решения по моделированию, компромиссы и результаты оценки
- Свободное владение английским языком
Желательная квалификация / Будет плюсом
- Kaggle Grandmaster, Master или несколько золотых медалей
- Опыт создания бенчмарков, оценок или задач для ML-соревнований
- Опыт работы с генеративными моделями, LLM или мультимодальным обучением
- Опыт крупномасштабного распределенного обучения
- Предыдущий опыт в исследованиях ИИ, на платформах ML или в командах инфраструктуры
- Вклад в технические блоги, проекты с открытым исходным кодом или научные публикации
- Предыдущий опыт наставничества или технического руководства
- Опубликованные научные работы (конференции или журналы)
- Опыт тонкой настройки LLM, работы с векторными базами данных или рабочими процессами генеративного ИИ
- Знакомство с инструментами MLOps: Weights & Biases, MLflow, Airflow, Docker и т.д.
- Опыт оптимизации производительности инференса и развертывания моделей в масштабе
Почему стоит присоединиться
- Получите доступ к передовым рабочим процессам исследований ИИ, тесно сотрудничая с дата-сайентистами, инженерами по машинному обучению и лидерами исследований, формирующими системы ИИ следующего поколения.
- Работайте над высокоэффективными задачами машинного обучения, экспериментируя с передовыми стратегиями моделирования, новыми аналитическими методами и методами валидации соревновательного уровня.
- Сотрудничайте с ведущими мировыми лабораториями ИИ и техническими командами, работающими на переднем крае прогнозирования, экспериментирования, табличного машинного обучения и мультимодальной аналитики.
- Гибкие варианты занятости (30–40 часов в неделю или полный рабочий день) — идеально для инженеров по машинному обучению, стремящихся применить навыки решения проблем уровня Kaggle к реальным, производственным системам ИИ.
- Полностью удаленная работа и глобальная гибкость — оптимизировано для глубокой технической работы, асинхронного сотрудничества и высокопроизводительных исследовательских сред.
Уведомления о Вакансиях