智能体- LLMOps 平台技术负责人-CodeBuddy/WorkBuddy

Tencent • Shenzhen, Guangdong Province • Posted June 07, 2026

About the Role

智能体- LLMOps 平台技术负责人-CodeBuddy/WorkBuddy 深圳 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 CSIG 点击了解更多BG信息 技术 五年以上工作经验 更新于年05月15日
  • 在腾讯,技术人解决问题的激情永不熄灭。无论是面对产品、程序的问题,还是生活与人的问题,腾讯技术人都力图交出漂亮的答卷。我们善用科学工具,以强大的思维之力创造世界,为卓越的产品体验保驾护航,也为公司和产品策略提出宝贵的洞见,用技术引领新的变革。这里的每位成员,既传承着长久以来的务实文化,又时刻以创新眼光瞄准大海星辰。我们十分期待你加入这样一个「技术社区」,分享团队能量,尽情发挥所长。
  • 岗位职责
  • 1.负责以数据为中心的 LLMOps 平台整体架构设计与建设,覆盖大语言模型 Post-train(SFT、RLHF、DPO 等)全阶段的数据管线与训练工程体系;
    2.主导大模型训练数据生命周期管理,包括大规模语料采集与清洗、数据质量评估与过滤、数据去重去污染、数据版本管理与血缘追踪,确保各训练阶段数据的高质量与可溯源;
    3.带领工程团队构建高效的数据处理流水线与编排调度系统,支撑 PB 级语料的高吞吐处理,持续优化数据准备到训练启动的端到端效率。负责团队的技术方向把控、人才培养与跨团队协作,推动工程文化与最佳实践落地;
    4.建设模型训练实验管理与可复现体系,打通数据准备、分布式训练、评估验证(Benchmark / Human Eval)、模型注册到部署上线的全流程自动化,缩短模型迭代周期;
    5.构建 Post-train 阶段的数据闭环能力,包括人类偏好数据采集与管理、RLHF/DPO 训练数据管线、合成数据生成(Synthetic Data)与质量评估体系;
    6.持续提升平台运行稳定性、安全性与可观测性,建立完善的 SLA 体系、训练容错与断点续训机制,保障大规模训练任务的连续性;
    7.优化大规模 GPU/异构计算集群的资源调度策略,提升多任务并行训练效率与集群利用率,降低基础设施成本;
    8.紧跟 LLM 领域前沿动态(如...