智能体- LLMOps 平台技术负责人-CodeBuddy/WorkBuddy

Tencent • Shenzhen, Guangdong Province • Posted June 07, 2026
About the Role

            智能体- LLMOps 平台技术负责人-CodeBuddy/WorkBuddy 深圳 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 CSIG 点击了解更多BG信息 技术 五年以上工作经验 更新于年05月15日 在腾讯，技术人解决问题的激情永不熄灭。无论是面对产品、程序的问题，还是生活与人的问题，腾讯技术人都力图交出漂亮的答卷。我们善用科学工具，以强大的思维之力创造世界，为卓越的产品体验保驾护航，也为公司和产品策略提出宝贵的洞见，用技术引领新的变革。这里的每位成员，既传承着长久以来的务实文化，又时刻以创新眼光瞄准大海星辰。我们十分期待你加入这样一个「技术社区」，分享团队能量，尽情发挥所长。
 岗位职责 1.负责以数据为中心的 LLMOps 平台整体架构设计与建设，覆盖大语言模型 Post-train（SFT、RLHF、DPO 等）全阶段的数据管线与训练工程体系；
2.主导大模型训练数据生命周期管理，包括大规模语料采集与清洗、数据质量评估与过滤、数据去重去污染、数据版本管理与血缘追踪，确保各训练阶段数据的高质量与可溯源；
3.带领工程团队构建高效的数据处理流水线与编排调度系统，支撑 PB 级语料的高吞吐处理，持续优化数据准备到训练启动的端到端效率。负责团队的技术方向把控、人才培养与跨团队协作，推动工程文化与最佳实践落地；
4.建设模型训练实验管理与可复现体系，打通数据准备、分布式训练、评估验证（Benchmark / Human Eval）、模型注册到部署上线的全流程自动化，缩短模型迭代周期；
5.构建 Post-train 阶段的数据闭环能力，包括人类偏好数据采集与管理、RLHF/DPO 训练数据管线、合成数据生成（Synthetic Data）与质量评估体系；
6.持续提升平台运行稳定性、安全性与可观测性，建立完善的 SLA 体系、训练容错与断点续训机制，保障大规模训练任务的连续性；
7.优化大规模 GPU/异构计算集群的资源调度策略，提升多任务并行训练效率与集群利用率，降低基础设施成本；
8.紧跟 LLM 领域前沿动态（如...