referry - Job Search Platform Logoreferry
Посмотреть все вакансии

Ведущий аннотатор кода / Инженер по оценке языковых моделей (по контракту)

3 часа назад|Ямайка|$75-$90/ч|Freelance|10+ лет опыта|Leading AI Lab
Data AnnotationSoftware EngineeringPython

💡 Совет по отклику: Нажав «Откликнуться на Braintrust бесплатно», вы перейдете на официальный сайт Braintrust. Это на 100% бесплатно для вас и помогает поддерживать нашу платформу за счет реферальных бонусов.
⚠️ Примечание о переводе: Информация о вакансии переведена с помощью ИИ. При неточностях или неоднозначностях ориентируйтесь на оригинал на английском.

Обзор роли

Это контрактная позиция - изначально на 6 месяцев - с возможностью продления. Местоположение: предпочтительно Париж; допускается удаленная работа из Европы для сильных кандидатов

Мы разрабатываем и оцениваем передовые языковые модели (LLM) и ищем опытных инженеров-программистов для присоединения к нашей команде оценки и аннотации. Эта роль сочетает в себе практическую разработку ПО, оценку моделей и прикладной ИИ и играет ключевую роль в повышении надежности моделей, их логики и качества кода.

Вы будете создавать сложные задачи по программированию, оценивать выходные данные моделей по строгим эталонам, выявлять режимы отказов и участвовать в процессах обучения с подкреплением и улучшения моделей.

Это не позиция для начинающих. Мы ищем специалистов с глубоким практическим опытом программирования, которые могут мыслить как инженер и оценщик одновременно.

Ваши обязанности

  • Создание качественных задач по программированию и эталонных решений (в формате бенчмарков, например, задачи типа SWE-Bench).
  • Оценка выходных данных LLM для генерации кода, рефакторинга, отладки и реализации задач.
  • Выявление и документирование отказов моделей, пограничных случаев и пробелов в логике.
  • Проведение сравнительных оценок между приватными LLM (на базе Mistral) и ведущими внешними моделями.
  • Создание или настройка сред программирования для поддержки оценки и обучения с подкреплением (RL).
  • Строгое соблюдение подробных инструкций по аннотации и оценке с высокой степенью согласованности.

Требования к кандидату

  • 10+ лет профессионального опыта в разработке ПО
  • Сильные навыки Python (обязательно)
  • Знание минимум одного дополнительного языка программирования (преимущество)
  • 1+ год опыта аннотации кода и/или оценки LLM (частичная занятость допустима) в крупной передовой AI-лаборатории или компании по инфраструктуре ИИ
  • Опыт ревью кода является преимуществом
  • Доказанная способность применять структурированные критерии оценки и писать четкие технические комментарии
  • Свободное владение английским языком (письменное и устное)
  • Опыт руководства командой или наставничества является существенным преимуществом

Почему эта роль

  • Работа с передовыми LLM
  • Применение практического инженерного подхода к оценке и улучшению моделей
  • Высоковлиятельная техническая работа в фокусированной команде опытных специалистов

Уведомления о Вакансиях

💰 258 высокооплачиваемых вакансий

Никакого спама, никогда
Отписка в любое время
Вакансии с лучших платформ