Ingénieur en apprentissage automatique senior - Évaluation de LLM / Création de tâches (Basé en Inde)
💡 Conseil pour postuler : Cliquer sur « Postuler gratuitement sur Mercor » vous redirigera vers le site officiel de Mercor. C'est 100 % gratuit pour vous et cela nous aide à soutenir notre plateforme grâce aux bonus de parrainage.
⚠️ Note de traduction : Ces informations ont été traduites par IA. En cas d’imprécision ou d’ambiguïté, référez-vous à la version originale en anglais.
Aperçu du rôle
Mercor recrute pour le compte d'un laboratoire de recherche en IA de premier plan afin d'intégrer des Ingénieurs en apprentissage automatique hautement qualifiés, ayant fait leurs preuves dans la construction, la formation et l'évaluation de systèmes ML haute performance dans des environnements réels. Dans ce rôle, vous concevrez, implémenterez et gérerez des ensembles de données, des tâches et des flux de travail d'évaluation d'apprentissage automatique de haute qualité qui alimentent la formation et l'évaluation comparative de systèmes d'IA avancés.
Ce poste est idéal pour les ingénieurs qui ont excellé dans des contextes d'apprentissage automatique compétitifs tels que Kaggle, possèdent une intuition de modélisation approfondie et peuvent traduire des problèmes complexes du monde réel en pipelines et ensembles de données ML robustes et bien structurés. Vous travaillerez en étroite collaboration avec des chercheurs et des ingénieurs pour développer des problèmes ML réalistes, garantir la qualité des ensembles de données et mener des expérimentations reproductibles et à fort impact.
Les candidats doivent avoir 3 à 5 ans et plus d'expérience en ML appliqué ou un solide parcours en ML compétitif, et doivent être basés en Inde. Les candidats idéaux maîtrisent Python, ont de l'expérience dans la construction de pipelines reproductibles et sont familiers avec les frameworks d'évaluation comparative, les méthodologies de notation et les meilleures pratiques d'évaluation ML.
Responsabilités
- Cadrer des problèmes ML uniques pour améliorer les capacités ML des LLM.
- Concevoir, construire et optimiser des modèles d'apprentissage automatique pour des tâches de classification, de prédiction, de PNL, de recommandation ou génératives.
- Mener des cycles d'expérimentation rapides, évaluer les performances des modèles et itérer continuellement.
- Effectuer de l'ingénierie de caractéristiques avancée et du prétraitement de données.
- Implémenter des tests adversariaux, des vérifications de robustesse des modèles et des évaluations de biais.
- Affiner, évaluer et déployer des modèles basés sur des transformeurs si nécessaire.
- Maintenir une documentation claire des ensembles de données, des expériences et des décisions de modèle.
- Se tenir informé des dernières recherches, outils et techniques ML pour faire progresser les capacités de modélisation.
Qualifications requises
- Au moins 3 à 5 ans d'expérience à temps plein dans le développement de modèles d'apprentissage automatique
- Diplôme technique en informatique, génie électrique, statistique, mathématiques ou un domaine connexe
- Expérience démontrée en apprentissage automatique compétitif (Kaggle, DrivenData ou équivalent)
- Preuve de performances de haut niveau dans les compétitions ML (médailles Kaggle, placements en finale, classements au tableau des leaders)
- Maîtrise avérée de Python, PyTorch/TensorFlow et des frameworks ML/PNL modernes
- Solide compréhension des fondamentaux du ML : statistiques, optimisation, évaluation de modèles, architectures
- Expérience avec l'entraînement distribué, les pipelines ML et le suivi d'expériences
- Solides compétences en résolution de problèmes et pensée algorithmique
- Expérience de travail avec des environnements cloud (AWS/GCP/Azure)
- Compétences analytiques, de communication et interpersonnelles exceptionnelles
- Capacité à expliquer clairement les décisions de modélisation, les compromis et les résultats d'évaluation
- Maîtrise de l'anglais
Atouts / Souhaitable
- Kaggle Grandmaster, Master, ou plusieurs médailles d'or
- Expérience dans la création de benchmarks, d'évaluations ou de problèmes de défi ML
- Expérience avec les modèles génératifs, les LLM ou l'apprentissage multimodal
- Expérience avec l'entraînement distribué à grande échelle
- Expérience préalable en recherche en IA, plateformes ML ou équipes d'infrastructure
- Contributions à des blogs techniques, des projets open source ou des publications de recherche
- Expérience préalable en mentorat ou en leadership technique
- Articles de recherche publiés (conférence ou revue)
- Expérience avec le fine-tuning de LLM, les bases de données vectorielles ou les workflows d'IA générative
- Familiarité avec les outils MLOps : Weights & Biases, MLflow, Airflow, Docker, etc.
- Expérience dans l'optimisation des performances d'inférence et le déploiement de modèles à l'échelle
Pourquoi nous rejoindre
- Bénéficier d'une exposition aux workflows de recherche en IA de pointe, en collaborant étroitement avec des scientifiques des données, des ingénieurs ML et des leaders de la recherche qui façonnent les systèmes d'IA de nouvelle génération.
- Travailler sur des défis d'apprentissage automatique à fort impact tout en expérimentant des stratégies de modélisation avancées, de nouvelles méthodes analytiques et des techniques de validation de niveau compétition.
- Collaborer avec des laboratoires d'IA et des équipes techniques de renommée mondiale opérant à la pointe de la prévision, de l'expérimentation, du ML tabulaire et de l'analyse multimodale.
- Options d'engagement flexibles (30 à 40 heures/semaine ou à temps plein) — idéal pour les ingénieurs ML désireux d'appliquer la résolution de problèmes de niveau Kaggle à des systèmes d'IA réels et de qualité production.
- Entièrement à distance et flexible à l'échelle mondiale — optimisé pour un travail technique approfondi, une collaboration asynchrone et des environnements de recherche à haut rendement.
Recevez des alertes d'emploi personnalisées