大模型系统实验室研究助理
Posted: 5 hours ago
Job Description
该职位来源于猎聘 大模型底层系统技术研究助理招聘 我们正在寻找一位对大模型底层系统技术满怀热忱的研究助理。您将投身于实验室的前沿研究项目,专注探索通过系统优化、并行计算与硬件协同设计,突破大规模语言模型效率瓶颈的有效路径。您的工作成果将在产业界发挥关键作用,并有机会助力产出高质量学术论文。 一、核心职责(一)研究与开发 参与大模型相关系统项目的设计与落地,具体涵盖: 1. **高性能推理引擎**:钻研KV-Cache优化、动态批处理、连续推理等技术,致力于降低延迟,提升系统吞吐能力。 2. **高效训练系统**:探究分布式训练框架(如DeepSpeed、Verl)、混合并行策略、显存优化等方面,助力提升训练效率。 3. **硬件协同设计**:针对GPU/国产AI芯片开展内核优化、算子融合及性能调优工作,推动硬件与软件的高效协同。 (二)系统实现与评测 将算法理念转化为高性能、可重复的代码(C++/CUDA/Python),精心设计严谨实验,对系统性能展开全面评估与深入分析,负责实验操作与维护、数据收集与剖析、实验报告撰写等工作。 (三)学术贡献 开展文献检索与管理工作,协助撰写高质量学术论文与专利申请材料,参与国际知名学术会议(如OSDI、EuroSys、MLSys、PPoPP等)的投稿事宜,参与具有较高影响力的国际竞赛。 (四)其他 参与维护实验室的开源项目,积极与社区互动交流,解决相关问题,贡献代码;负责纵向、横向等项目的申请材料撰写;承担实验室日常管理任务,如知识库维护、会议纪要整理等。 二、任职要求(一)必需条件 1. **学历背景**:计算机科学、人工智能、软件工程或相关专业的硕士生,或具有突出项目经验的优秀本科生。 2. **编程能力**: 熟练掌握Python和PyTorch框架。 具备扎实的C/C++编程能力与良好的软件工程素养。 3. **系统基础**:对操作系统、计算机体系结构、并行计算有基本认知。 4. **个人特质**: 具备较强的动手实践能力,有强烈的解决问题意愿,热衷于钻研底层技术。 拥有良好的学习能力、团队协作精神与沟通能力。 对技术有较高追求,能够承受一定工作压力,对解决复杂问题富有热情。 (二)符合以下条件者优先(加分项) 1. 有CUDA/Triton等GPU编程经验,或具备内核调试与优化经验。 2. 熟悉至少一种大模型推理框架(如vLLM、TensorRT-LLM、TGI)或训练框架(如DeepSpeed、ColossalAI)的源码。 3. 了解编译技术(如TVM、MLIR)或硬件加速器架构。 4. 在GitHub上有高质量的开源项目贡献或运营技术博客。 5. 有相关领域高水平学术会议论文发表或投稿经历。 三、我们提供 1. **有竞争力的薪酬待遇**:提供具有市场竞争力的助研津贴(具体面议)。 2. **优秀的科研平台**:单位配备NVIDIA A100/H100等高性能计算资源,为科研工作提供有力支撑。 3. **一流的学术指导**:导师和团队将提供细致的科研指导,助力您探索前沿课题,全力支持您发表优质论文。 4. **广阔的成长空间**:表现优异者,可优先获得: 推荐赴国内外高校、研究机构或企业(如微软、英伟达、阿里、字节等)访问、实习或工作的机会。 升学的推荐和机会
Job Application Tips
- Tailor your resume to highlight relevant experience for this position
- Write a compelling cover letter that addresses the specific requirements
- Research the company culture and values before applying
- Prepare examples of your work that demonstrate your skills
- Follow up on your application after a reasonable time period