【字节跳动AILab大模型推理强化学习方向实习生】
- yiczho LV.工兵
- 2024/8/2 23:30:24
Open地点:北京/上海
--职位描述
- 大模型在数学推理方面的算法研发
- 强化学习和机器学习的训练调优
--职位要求
- 在机器学习、人工智能、数理统计等相关专业的本科生或研究生
- 正在从事强化学习/RLHF、智能体的规划和搜索(Planning & Search)、大语言模型、NLP、多智能体强化学习、博弈论等至少一个相关方向的工作或对其有深入了解
- 有较强的代码实现能力
- 有深度学习模型训练调优、数据治理等方面的经验优先考虑
- 有Deepspeed/Megatron等实际经验的优先考虑
- 有Ray/Rllib或其他强化学习包使用经验的优先考虑
联系方式:zhouyichi.123@bytedance.com
--职位描述
- 大模型在数学推理方面的算法研发
- 强化学习和机器学习的训练调优
--职位要求
- 在机器学习、人工智能、数理统计等相关专业的本科生或研究生
- 正在从事强化学习/RLHF、智能体的规划和搜索(Planning & Search)、大语言模型、NLP、多智能体强化学习、博弈论等至少一个相关方向的工作或对其有深入了解
- 有较强的代码实现能力
- 有深度学习模型训练调优、数据治理等方面的经验优先考虑
- 有Deepspeed/Megatron等实际经验的优先考虑
- 有Ray/Rllib或其他强化学习包使用经验的优先考虑
联系方式:zhouyichi.123@bytedance.com