大模型性能优化研发专家
Tencent • Beijing, Beijing • Posted June 29, 2026
About the Role
大模型性能优化研发专家 北京 分享 在腾讯,后台开发工程师不仅是“又快又稳”的问题解决专家,更是生态共创者。你将与技术团队一同沉淀优质代码,让它成为我们共有的宝贵资产。在不同的业务场景和技术发展阶段,你的架构思维也将帮助更多协作团队拓展新的思考。我们也珍视你的挑战精神,同时欢迎你一起参与团队愿景、文化和产品方向的探讨。 岗位职责 1.训推框架开发与优化:基于云平台和业界常见训推框架,开发加速方案,满足公有云客户对性能的极致需求;
2.应用优化:参与重点项目POC,分析性能瓶颈,快速定位和解决重点问题;
3.前沿技术探索:跟踪学术动态,将最新研究成果转化为框架功能,提升产品竞争力;
4.自研核心业务支持:参与腾讯内部核心业务相关训推框架的交付与迭代。 岗位要求 1.熟悉主流的大模型推理框架及其加速技术,如vLLM、SGlang、TensorRT-LLM等,熟练分析单机及分布式情况下的性能热点和优化手段;
2.熟悉主流的训练框架和分布式框架,包括Megatron-LM、DeepSpeed、verL、LLama-factory等,熟悉常见的分布式并行策略,了解显存、通信与计算相关性能瓶颈和优化手段;
3.熟悉自动驾驶相关算法者优先,例如BEVformer、MapTRV2、SparseDrive、FlashOCC、Pointpillars等,熟练分析自驾场景的性能瓶颈和优化方案;
4.熟悉CUDA编程、高性能计算优化(如算子融合、通信优化)者优先;
5.熟悉NCCL、MPI等集合通信算法者优先;
6.工程经验上具备大型项目架构设计能力,能独立解决性能调优、多节点调试等复杂问题;
7.具备良好的沟通能力与团队协作精神,有强烈的技术热情者优先。
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
收藏 CSIG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月26日2.应用优化:参与重点项目POC,分析性能瓶颈,快速定位和解决重点问题;
3.前沿技术探索:跟踪学术动态,将最新研究成果转化为框架功能,提升产品竞争力;
4.自研核心业务支持:参与腾讯内部核心业务相关训推框架的交付与迭代。
2.熟悉主流的训练框架和分布式框架,包括Megatron-LM、DeepSpeed、verL、LLama-factory等,熟悉常见的分布式并行策略,了解显存、通信与计算相关性能瓶颈和优化手段;
3.熟悉自动驾驶相关算法者优先,例如BEVformer、MapTRV2、SparseDrive、FlashOCC、Pointpillars等,熟练分析自驾场景的性能瓶颈和优化方案;
4.熟悉CUDA编程、高性能计算优化(如算子融合、通信优化)者优先;
5.熟悉NCCL、MPI等集合通信算法者优先;
6.工程经验上具备大型项目架构设计能力,能独立解决性能调优、多节点调试等复杂问题;
7.具备良好的沟通能力与团队协作精神,有强烈的技术热情者优先。