企业微信-AI Agent高级评测工程师

Tencent • Guangzhou, Guangdong Province • Posted June 30, 2026

About the Role

企业微信-AI Agent高级评测工程师 广州 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 WXG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月12日 岗位职责
  • 1.负责评测体系建设:设计并持续优化 AI Agent 评测框架,覆盖任务完成率、多轮对话质量、工具调用准确性等核心维度
    2.评测执行与分析:针对企业微信 AI Agent 场景(总结、搜索、销售、审批、日程助理等)制定测试用例,执行自动化与人工评测,输出量化分析报告
    3. Benchmark 研究与构建:跟踪业界主流 Agent 评测基准(如 AgentBench、PinchBench、TAU-bench等),结合企业微信业务场景进行改造与落地
    4.数据治理:推动数据标注规范制定和标注质量管控
    5. 问题定位与反馈:深度分析 Agent 失败案例,精准定位规划、记忆、工具调用等模块的能力短板,与研发/产品团队闭环跟进
  • 岗位要求
  • 1.计算机/AI 相关专业本科及以上,熟悉 LLM 基础原理,了解 RAG、Function Calling、Multi-Agent 等主流 Agent 技术架构
    2.有 NLP 模型评测、ASR评测或 AI 产品质量保障工作经验,熟悉自动化测试框架者优先
    3.有数据标注规范设计或标注平台使用经验者加分
    4.具备企业协作软件或 ToB 产品的测试经验,能将业务场景转化为可量化的评测指标
    5.逻辑清晰,善于结构化表达,能在研发、产品、运营等多角色间高效协作,推动问题闭环落地