

作为开发者,我们通过 API 将大模型的能力集成到应用中。我们将使用业界广泛采纳的 OpenAl Python SDK 来调用 通义千问大模型。

常见问题
1
ModuleNotFoundError: No module named 'dashscope'
☑ 解决方案: pip install dashscope
创建一个名为“公司小蜜”的助手,赋予其“负责教育内容开发公司的答疑”的角色。


大模型知识渊博,但其知识仅限于公开的训练数据。它对你公司的内部情况一无所知。
要解决模型缺乏私域知识和回答不稳定的问题,我们必须先揭开它的“神秘面纱”,理解其工作机制。

以提问“ACP is a very”为例,我们将有完整解析大模型从接收输入到生成回答的五个核心阶段。


temperature 参数调优①:用 temperature 控制创造力 通过调整候选 Token 的概率分布来控制生成内容的随机性。

top_p 筛选候选范围top_p 是一种筛选机制。它按概率从高到低累加,只在累计概率达到阈值的 Token 中进行采样。

既然模型不知道内部知识,最直接的方法就是在提问时临时告诉它。

当你试图将几十上百页的公司文档都用同样的方式“喂”给大模型时,会立即遇到错误。

系统性地设计、构建和优化上下文的实践,旨在正确的时间,将最相关、最精准的知识,动态地加载 到大模型有限的上下文窗口中。
许多大模型应用的失败,并非模型本身不够智能,而是“上下文”的失败。

在我们解决私域知识问答的征途中,RAG 是最直接、最有效的解决方案。

将私有知识文档转换为可以被高效检索的形式。这是一个一次性的离线过程。

关键: 经过向量化,文本的“语义”被数字化,使得计算机可以通过计算向量间的距离来快速找到内容上最相似的文本片段。
当用户发起提问时,实时地找到相关知识并生成精准回答。

结论:RAG 架构既解决了上下文窗口的限制,又通过精准检索显著提升了回答的准确性和相关性,成功完成了我们的任务。