企业微信-AI Agent高级评测工程师

Tencent • Guangzhou, Guangdong Province • Posted June 30, 2026
About the Role

            企业微信-AI Agent高级评测工程师 广州 分享 
分享岗位
方式1:复制岗位链接
方式2:分享岗位海报
手机扫描二维码分享
 收藏 WXG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月12日 岗位职责 1.负责评测体系建设：设计并持续优化 AI Agent 评测框架，覆盖任务完成率、多轮对话质量、工具调用准确性等核心维度
2.评测执行与分析：针对企业微信 AI Agent 场景（总结、搜索、销售、审批、日程助理等）制定测试用例，执行自动化与人工评测，输出量化分析报告
3. Benchmark 研究与构建：跟踪业界主流 Agent 评测基准（如 AgentBench、PinchBench、TAU-bench等），结合企业微信业务场景进行改造与落地
4.数据治理：推动数据标注规范制定和标注质量管控
5. 问题定位与反馈：深度分析 Agent 失败案例，精准定位规划、记忆、工具调用等模块的能力短板，与研发/产品团队闭环跟进
 岗位要求 1.计算机/AI 相关专业本科及以上，熟悉 LLM 基础原理，了解 RAG、Function Calling、Multi-Agent 等主流 Agent 技术架构
2.有 NLP 模型评测、ASR评测或 AI 产品质量保障工作经验，熟悉自动化测试框架者优先
3.有数据标注规范设计或标注平台使用经验者加分
4.具备企业协作软件或 ToB 产品的测试经验，能将业务场景转化为可量化的评测指标
5.逻辑清晰，善于结构化表达，能在研发、产品、运营等多角色间高效协作，推动问题闭环落地