【字节跳动AILab大模型推理强化学习方向实习生】,北京邮电大学论坛

【字节跳动AILab大模型推理强化学习方向实习生】

浏览：2537 评论：0 人

yiczho LV.工兵: 2024/8/2 23:30:24

Open地点：北京/上海

--职位描述
- 大模型在数学推理方面的算法研发
- 强化学习和机器学习的训练调优

--职位要求
- 在机器学习、人工智能、数理统计等相关专业的本科生或研究生
- 正在从事强化学习/RLHF、智能体的规划和搜索(Planning & Search)、大语言模型、NLP、多智能体强化学习、博弈论等至少一个相关方向的工作或对其有深入了解
- 有较强的代码实现能力
- 有深度学习模型训练调优、数据治理等方面的经验优先考虑
- 有Deepspeed/Megatron等实际经验的优先考虑
- 有Ray/Rllib或其他强化学习包使用经验的优先考虑
联系方式：zhouyichi.123@bytedance.com