【字节跳动AILab大模型推理强化学习方向实习生】
  • 浏览:2537 评论:0 人
  • Open地点:北京/上海
     
    --职位描述
    - 大模型在数学推理方面的算法研发
    - 强化学习和机器学习的训练调优

    --职位要求
    - 在机器学习、人工智能、数理统计等相关专业的本科生或研究生
    - 正在从事强化学习/RLHF、智能体的规划和搜索(Planning & Search)、大语言模型、NLP、多智能体强化学习、博弈论等至少一个相关方向的工作或对其有深入了解
    - 有较强的代码实现能力
    - 有深度学习模型训练调优、数据治理等方面的经验优先考虑
    - 有Deepspeed/Megatron等实际经验的优先考虑
    - 有Ray/Rllib或其他强化学习包使用经验的优先考虑
    联系方式:zhouyichi.123@bytedance.com