马胜振
通用AI业务评测平台能力建设
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
马胜振
社区首页
>
专栏
>
通用AI业务评测平台能力建设
通用AI业务评测平台能力建设
马胜振
关注
发布于 2026-05-27 11:39:57
发布于 2026-05-27 11:39:57
95
0
举报
概述
本次输出的AI评测的认知迭代和平台能力迭代规划,以BC双端AI企微场景的业务专项为背景,沟通收集QA同学,产品同学在整个过程中对于现有工具和平台的使用反馈和建议,结合过程中各角色协作过程中沟通讨论的主要问题,思考总结而成。
文章被收录于专栏:
AI质量与效能体系建设
AI质量与效能体系建设
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
aiops
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
aiops
#AI评测
#LLM as a judge
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
前言:团队现有通用评测平台能力
『业务实践过程中的认知和系统能力迭代需求』
问题一:如何做通用的评测用例集(可用来做agent验证的基线case)在模型优化后做快速验证评估。
问题二:通用的LLM评测规则是不是足够?评测逻辑是否业务认可?
问题三:针对单条用例一个最终的评测通过结果+评测说明是否足够?
问题四:团队协作上目前缺少什么?造成开发和测试过程中才陆续发现一些隐藏的问题?
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐