暂无搜索历史
对于MCP,简单而已,它就是让 AI Agent 能连上你们公司各种系统(Salesforce、GitHub、Jira 这些)的一套标准。各大厂商都在推,每个 ...
很多团队目前的评估现状是:“人工肉眼试用、凭主观感受打分”。运行顺畅就是“神级应用”,偶尔出错就是“能力不足”,效果不好就盲目去微调大模型。这种“盲人摸象”式的...
在与LLM交互时,提问的方式——也就是我们所说的“提示词”——对最终输出的质量有着至关重要的影响。因此,设计既包含定制化静态提示词,又能根据上下文变化的动态提示...
很长一段时间里,行业里弥漫着一种“暴力美学”:很多人理所当然地以为,想让 AI 变得更聪明、更能干,唯一的路径就是造出更大的模型。于是,我们见证了参数量的狂飙,...
从大型数据集中检索信息是具有挑战性的,尤其是当共享的概念跨越多个来源而没有明确的链接的时候。假设有一堆想要查询的文档,并且需要可靠的的软件来从这些文档中检索相关...
当下的AI时代,现成的AI解决方案遍地都是,很多人觉得搭建一个AI系统不过是“拼拼组件、调调参数”的小事。但事实真的如此吗?看似简单的AI开发,背后藏着无数坑:...
作为产品经理,我们每天都在和数据打交道——从用户行为分析到功能效果验证,从决策依据推导到业务增长预测,而统计学正是读懂数据、用对数据的核心工具。它不是复杂的公式...
人工智能安全领域一直在以惊人的速度发展,研究人员发现新漏洞的速度比打补丁的速度还要快,例如MCP 的安全性问题。
随着大模型的发展,为了避免或缓解幻觉和过时知识的推理缺陷,出现了检索增强生成 (RAG)、知识增强生成 (KAG) 和缓存增强生成 (CAG) 等应用框架。每个...
这里讨论的OpenSPG—KAG是知识增强生成的一个特例,是一个基于 OpenSPG 引擎和大型语言模型的逻辑推理和问答框架,用于为垂直领域知识库构建逻辑推理和...
KV缓存是现代大模型服务方式的基础实现细节,在KV缓存中,各个注意力层的键和值被保存,有效地保存了整个模型的中间表示,以便可以用于进一步的自回归生成传递。
在本地运行LLM,为我们提供了一种既能充分利用 AI 能力,又能有效保护数据隐私的理想方式。相比依赖云端服务的使用模式,本地部署让我们在享受无限访问 AI 的自...
当启动 Ollama 时,它会自动启动侦听端口 11434 的REST API。这个REST API允许您从任何支持 HTTP 请求的编程语言或环境与 Olla...
【引】“你永远无法精通一种编程语言,除非两种!” 或许,对于智能体之间的通信协议如MCP 和A2A 也是如此。
从 GPT 这样的模型开始,大语言模型领域近年来取得了显著的进展。然而,即使这些模型变得越来越强大,它们在回答用户查询时的准确性也往往达不到预期。为了解决这个问...
别慌!PyTorch作为深度学习界的传奇,有一整套性能优化的方法。从瓶颈诊断到内存精打细算,从分布式加速到部署黑科技,这10个技巧不仅能让你的模型“跑得更快”,...
2025年的最后一个周末,参见了本年度的最后一次社区活动——腾讯云架构师峰会,主题为“智效跃迁,架构无界”。
延迟和成本是当今基于 LLM 的聊天机器人面临的重大挑战。这个问题在检索增强生成(RAG)代理中更加明显,在返回用户答案之前,我们必须对 LLM 进行多次调用。...
【引】令人不悦的是,年底有很多大厂开始了又一轮的“优化”,一些朋友“毕业”了, 谈到了找工作时一些技术上的“查缺补漏”,涉及了性能工程的一些问题,遂成此文。
几乎所有组织都在尝试使用大模型,可以用大模型回答问题、生成故事、编写代码片段,甚至总结报告。但是有一个问题: 大模型的输出通常是非结构化的。如果要求他们提供 J...