首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >通用AI业务评测平台能力建设

通用AI业务评测平台能力建设

作者头像
马胜振
发布2026-05-27 11:39:57
发布2026-05-27 11:39:57
950
举报
概述
本次输出的AI评测的认知迭代和平台能力迭代规划,以BC双端AI企微场景的业务专项为背景,沟通收集QA同学,产品同学在整个过程中对于现有工具和平台的使用反馈和建议,结合过程中各角色协作过程中沟通讨论的主要问题,思考总结而成。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言:团队现有通用评测平台能力
  • 『业务实践过程中的认知和系统能力迭代需求』
    • 问题一:如何做通用的评测用例集(可用来做agent验证的基线case)在模型优化后做快速验证评估。
    • 问题二:通用的LLM评测规则是不是足够?评测逻辑是否业务认可?
      • 问题三:针对单条用例一个最终的评测通过结果+评测说明是否足够?
    • 问题四:团队协作上目前缺少什么?造成开发和测试过程中才陆续发现一些隐藏的问题?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档