referry - Job Search Platform Logoreferry
ดูโอกาสงานทั้งหมด

ผู้เชี่ยวชาญด้านการจัดทำข้อมูลโค้ด / วิศวกรประเมินผลโมเดลภาษาขนาดใหญ่ (สัญญาจ้าง)

3 ชั่วโมงที่แล้ว|จาเมกา|$75-$90/ชม.|Freelance|10+ ปีประสบการณ์|Leading AI Lab
Data AnnotationSoftware EngineeringPython

💡 เคล็ดลับการสมัคร: การคลิก "สมัครฟรีที่ Braintrust" จะนำคุณไปยังเว็บไซต์ทางการของ Braintrust ซึ่งฟรี 100% สำหรับคุณและยังช่วยสนับสนุนแพลตฟอร์มของเราผ่านโบนัสการแนะนำ
⚠️ หมายเหตุการแปล: ข้อมูลตำแหน่งงานนี้แปลโดย AI หากมีความคลาดเคลื่อนหรือกำกวม โปรดยึดฉบับภาษาอังกฤษเป็นหลัก。

ภาพรวมบทบาท

เป็นตำแหน่งจ้างเหมา - ระยะเวลาเริ่มต้น 6 เดือน - มีโอกาสต่อสัญญาในระยะยาว สถานที่ปฏิบัติงาน: ตั้งอยู่ที่ปารีสเป็นหลัก; หรือทำงานทางไกลในยุโรปสำหรับผู้สมัครที่มีคุณสมบัติเด่น

เรากำลังพัฒนาและประเมินผลโมเดลภาษาขนาดใหญ่ (LLMs) ที่ทันสมัยที่สุด และกำลังมองหาวิศวกรซอฟต์แวร์ที่มีประสบการณ์มาร่วมทีมประเมินและจัดทำข้อมูลของเรา บทบาทนี้อยู่ในจุดตัดระหว่าง วิศวกรรมซอฟต์แวร์ในโลกจริง การประเมินผลโมเดล และ AI ประยุกต์ ซึ่งมีความสำคัญต่อการพัฒนาความน่าเชื่อถือ ความสามารถในการให้เหตุผล และคุณภาพของโค้ดโมเดล

คุณจะออกแบบแบบฝึกหัดการเขียนโค้ดที่ท้าทาย ประเมินผลลัพธ์ของโมเดลตามเกณฑ์มาตรฐานที่เข้มงวด ระบุรูปแบบความล้มเหลว และมีส่วนร่วมในกระบวนการเรียนรู้แบบเสริมแรงและการปรับปรุงโมเดล

นี่คือ ไม่ใช่ ตำแหน่งสำหรับผู้เริ่มต้น เราต้องการผู้ปฏิบัติงานที่มีประสบการณ์การเขียนโค้ดอย่างลึกซึ้ง และสามารถคิดและทำงานได้ทั้งในบทบาทวิศวกรและผู้ประเมิน

หน้าที่ความรับผิดชอบ

  • สร้างแบบทดสอบโค้ดและคำตอบอ้างอิงที่มีคุณภาพสูง (ในรูปแบบมาตรฐาน เช่น ปัญหาแบบ SWE-Bench)
  • ประเมินผลลัพธ์ของโมเดลภาษาขนาดใหญ่สำหรับงานสร้างโค้ด ปรับปรุงโค้ด แก้ไขข้อผิดพลาด และการพัฒนา
  • ระบุและบันทึกข้อผิดพลาดของโมเดล กรณีขอบเขต และช่องว่างในการให้เหตุผล
  • ดำเนินการประเมินผลแบบเปรียบเทียบระหว่างโมเดลภาษาขนาดใหญ่ภายใน (Mistral-based) และโมเดลชั้นนำจากภายนอก
  • สร้างหรือกำหนดสภาพแวดล้อมการเขียนโค้ดเพื่อสนับสนุนการประเมินผลและการเรียนรู้แบบเสริมแรง (RL)
  • ปฏิบัติตามแนวทางการจัดทำข้อมูลและประเมินผลอย่างละเอียดด้วยความแม่นยำสูง

คุณสมบัติที่เราต้องการ

  • มีประสบการณ์การพัฒนาซอฟต์แวร์ระดับมืออาชีพ 10 ปีขึ้นไป
  • มีทักษะภาษา Python ระดับสูง (จำเป็นต้องมี)
  • มีความรู้ในการใช้ ภาษาการเขียนโปรแกรมอย่างน้อยหนึ่งภาษาเพิ่มเติม (เป็นข้อได้เปรียบ)
  • มีประสบการณ์ด้านการจัดทำข้อมูลโค้ดและ/หรือการประเมินผลโมเดลภาษาขนาดใหญ่ 1 ปีขึ้นไป (สามารถทำงานแบบพาร์ทไทม์ได้) ในห้องปฏิบัติการ AI ชั้นนำหรือบริษัทโครงสร้างพื้นฐาน AI
  • มีประสบการณ์ การทบทวนโค้ด เป็นข้อได้เปรียบ
  • พิสูจน์แล้วว่าสามารถใช้เกณฑ์การประเมินผลอย่างเป็นระบบ และเขียนข้อเสนอแนะเชิงเทคนิคที่ชัดเจนได้
  • มีความคล่องแคล่วในการใช้ภาษาอังกฤษ (ทั้งการเขียนและการพูด)
  • มีประสบการณ์การเป็นหัวหน้าทีมหรือการให้คำปรึกษาเป็นข้อได้เปรียบมาก

ข้อดีของตำแหน่งนี้

  • ได้ทำงานร่วมกับโมเดลภาษาขนาดใหญ่ที่ทันสมัยที่สุดโดยตรง
  • นำความรู้ด้านวิศวกรรมในโลกจริงมาประยุกต์ในการประเมินและปรับปรุงโมเดล
  • ทำงานเชิงเทคนิคที่มีผลกระทบสูงร่วมกับทีมที่มีความเชี่ยวชาญสูงและมุ่งเน้นเป้าหมาย

รับการแจ้งเตือนงานที่เหมาะกับคุณ

💰 258 งานรายได้สูง

ไม่มีสแปมแน่นอน
ยกเลิกการติดตามได้ทุกเมื่อ
งานจากแพลตฟอร์มชั้นนำ