202503401-大模型系统方向访问学生(工程师)
Posted: 5 hours ago
Job Description
该职位来源于猎聘 一、岗位职责 1.大模型训练与推理系统优化: a.研究分布式训练框架(如Megatron-LM、DeepSpeed、ColossalAI等),优化计算/通信效率; b.探索低资源推理技术(模型压缩、量化、动态加载等)。 2.大模型与软硬件协同设计: a.针对GPU/TPU/RDAC等硬件特性优化模型架构与调度策略; b.设计高性能算子库或编译优化(如CUDA、Triton等)。 3.大模型部署与工程化: a.研究轻量化部署方案(服务化框架、边缘设备适配等); b.开发高效微调工具链(LoRA、Adapter等模块化支持)。 4.相关前沿问题: a.长上下文处理、MoE系统、多模态大模型系统设计等; b.RL训推一体优化。 二、任职要求 1.教育背景:计算机科学、人工智能、电子工程等相关专业在读硕士/博士,或优秀高年级本科生。 2.技术能力(满足至少2项): a.熟悉PyTorch/TensorFlow框架,有分布式训练或大模型调试经验; b.掌握CUDA/OpenCL等并行计算开发,或熟悉LLVM/TVM等编译器技术; c.了解大模型技术栈(如Transformer架构、RLHF流程、推理加速技术); d.有系统开发经验(参与过开源项目、熟悉C++/Rust等高性能语言)。 3.加分项: a.在MLSys、ASPLOS、OSDI等系统顶会或AI顶会(NeurIPS/ICML等)发表论文; b.在开源社区(如Megatron、vLLM、Verl等)贡献过代码; c.较强的工程能力(Git协作、性能 profiling 经验); d.知名竞赛获奖,如ICPC等。
Job Application Tips
- Tailor your resume to highlight relevant experience for this position
- Write a compelling cover letter that addresses the specific requirements
- Research the company culture and values before applying
- Prepare examples of your work that demonstrate your skills
- Follow up on your application after a reasonable time period