AI-Agent测试工程师招聘_博彦科技承德有限公司招聘

职位详情

AI-Agent测试工程师

1.6-3万

博彦科技承德有限公司

北京

5-10年

本科

05-17

工作地址

北京海淀区鼎好DH3鼎好大厦

职位描述

AI测试，要5年左右经验的，做过传统软件测试也有一些AI应用测试经验的比较合适，或者是近3年都在做AI应用相关测试的招聘JD：AI测试工程师岗位综述：负责B端Agent平台的质量体系建设与测试交付，覆盖功能、性能、评测、安全及可观测性，保障AI应用在高复杂度场景下的稳定可靠。核心职责：质量体系建设：建立适配B端Agent的质量体系与发布门禁，涵盖稳定性、工具成功率、引用一致性、安全、性能与成本指标。场景测试：负责多轮对话、工作流分支、工具链路（Tool Chain）、异步/长任务、并发、异常恢复、幂等与重试风暴等场景测试。自动化测试：搭建API测试体系（Tool Schema、接口Schema），基于Playwright实现E2E自动化（React管理台/编排器），管理SaaS与私有化测试数据及环境。评测体系：构建离线评测集（业务+对抗），实现规则/LLM-as-judge/人审自动评分，建立版本对比、回归门禁与漂移监控机制。安全合规测试：覆盖Prompt Injection、越权工具调用、RAG权限绕过、敏感信息泄露、审计链路完整性、离线数据驻留与脱敏校验。可观测与复现：基于Tracing/Metrics/Logs实现失败分类，建立对话与工具链路回放机制，生成复现脚本与根因分析，推动修复闭环。 AI工具提效：利用Cursor/Claude Code生成PyTest/Playwright脚本、API测试用例及对抗性/边界场景数据通过AI辅助日志分析、链路溯源、根因定位，自动生成失败复现脚本自动生成测试计划、缺陷分析报告、复盘总结及私有化检查清单用AI搭建评测集、生成LLM-as-judge评分规则，自动化版本对比与场景标注任职要求：计算机、信息技术相关专业本科及以上学历，5年以上测试经验，能主导复杂系统测试策略与质量闭环熟练Python自动化测试（PyTest），精通Playwright实现E2E 熟悉ToB测试关键场景：多租户、RBAC/ABAC、审计、配额/限流、灰度/回滚、私有化升级兼容（K8s与Docker Compose双形态）理解LLM/Agent非确定性特征及评测方法：结构化输出校验、工具失败模式、上下文污染、采样稳定性理解RAG测试链路：Milvus/PGVector/ES检索、权限过滤、引用溯源一致性、知识更新回归具备线上质量经验：监控告警、灰度放量、回滚与事故复盘加分项：有LLM/Agent评测或质量中台经验：数据集管理、版本对比、回归门禁、A/B实验、评分稳定性控制有对抗/红队经验：越狱、注入、数据外带（Exfiltration）、权限绕过熟悉OpenTelemetry/ELK/Prometheus，能基于Traces建立回放与复现工具具备性能与成本测试经验：并发、限流策略、重试风暴、Token成本与耗时分布

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕