embedding - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签embedding

#embedding

Embedding模型选型：OpenAI/BGE/M3E对比与私有化部署

陆业聪 6天前2026-07-16 12:55:18

• SK海力士CEO称史上最大存储短缺将在明年到来，考虑推出"内存即服务"模式应对算力扩张需求。

19410

目前仅此一家支持：向量索引加装前置过滤器

用户4035096 13天前2026-07-09 19:42:55

这条SQL的索引是items_pkey, 索引扫描到符合条件的记录后, 回表, 判断tuple可见性, 并且对可见tuple获得embedding字段的值, 再...

8100

大模型-代数基础知识(向量，矩阵，点积)

码农戏码 23天前2026-06-29 15:47:02

只有大小概念，没有方向的概念。通过一个具体的数值就能表达完整。比如：重量、温度、长度、提及、时间、热量等都数据标量

10100

如何判断“啥时候睡觉”和“几点休息”是同一个问题？一文搞懂向量搜索实战

全栈开发日记 23天前2026-06-29 13:38:48

你和你朋友的口味相似度有多高，通过肉眼就可以分辨，这只是二维向量，在计算机中判断两句话的相似度有很多维度，主流开源的模型大多数是1024维，商用的OpenAI的...

22623

VLM2Vec-V2：打破模态壁垒，迈向视频与文档理解的统一Embedding新纪元

唐国梁Tommy 27天前2026-06-25 20:54:14

今天，我们要深入探讨一篇引人注目的新研究——来自Salesforce Research、UC Santa Barbara等机构的《VLM2Vec-V2: Adv...

10100

深度解读 Qwen3 Embedding：从基础模型到SOTA文本Embedding与Reranker

唐国梁Tommy 27天前2026-06-25 20:30:20

对比了当前主流的开源文本嵌入模型（如GTE系列、E5系列、BGE系列、NV-Embed-v2、GritLM-7B）和商业API（如OpenAI的text-emb...

28110

RAG面试必问：Embedding模型到底怎么选？

王中阳AI编程 29天前2026-06-23 21:22:14

“为什么不用 BGE？中文场景下怎么评估？维度越高是不是越好？模型升级后历史向量怎么办？”

16700

Day9 学习日志：Embedding 与向量数据库

小小猪排画中游 2026-06-172026-06-17 08:32:49

📅 日期：2026-03-25 📌 定位：在「三国演义」语料上跑通本地 Word2Vec 与 DashScope 文本向量 API 两条链路，理解词级 vs...

14110

Day8 学习日志：CO-STAR 与「Embedding 课前知识储备」——Prompt、工具链与可观测性

小小猪排画中游 2026-06-172026-06-17 08:32:41

📅 日期：2026-03-24 📌 定位：向量与检索正式开课前，把输出可控、工具调用闭环、本地知识 mock、长文 Map-Reduce 和运行日志打牢。

11710

大模型视频理解（Video Understanding）技术详解：从多模态 Embedding 到场景语义

gavin1024 2026-06-012026-06-01 18:05:04

摘要视频理解正从标签识别跨越到场景语义。本文系统拆解多模态大模型如何对视频进行时序采样、跨模态对齐与场景推理，覆盖Embedding空间、注意力机制、时序建模...

94610

换了 Embedding 模型向量全废了？Go 实战大规模数据平滑重构

技术圈 2026-05-192026-05-19 17:52:22

在 AI 应用的生命周期中，向量数据库（Vector DB）的迁移往往比传统数据库更令人头疼。与关系型数据库只需导出 SQL 或同步 Binlog 不同，向量数...

15910

无 Embedding、无向量数据库的 RAG 方法：PageIndex 技术解析

deephub 2026-04-212026-04-21 20:26:53

PageIndex 是一种无向量、基于推理的检索增强生成（RAG）方法，无需 Embedding、分块或向量数据库即可从长文档中检索答案。

52710

ESM3蛋白质语言模型cookbook（2）

Tom2Code 2026-04-172026-04-17 17:25:25

使用ESM-C模型获取蛋白质的特征表达（embedding），进行一个简单蛋白质序列分类的任务。

24910

多 Aspect Embedding：将上下文信号编入向量相似性计算的检索架构

deephub 2026-04-152026-04-15 08:21:00

向量数据库的核心任务是对文本或其他非结构化数据生成的 Embedding 做相似性搜索。时间戳、文档类型、所有权一类的上下文约束，一般以外部过滤器的形式在向量搜...

14210

言必称Embedding,Transformer的Embedding与RAG的Embedding是什么关系？傻傻搞不清。。。干货满满，专治各种懵懵懂懂！！！

烟雨平生 2026-04-142026-04-14 18:49:28

先讲结论：Transformer的Embedding是模型的输入层，RAG的Embedding是一个完整的编码模型（如BERT），用于语义检索。

15010

Transformer灵魂1问：Embedding层的嵌入矩阵权重为什么要乘以sqrt(d_model)进行缩放？

烟雨平生 2026-04-142026-04-14 18:48:36

简单来说，这个缩放的核心目的是为了维持数值稳定性，保持梯度稳定、防止数值爆炸或消失，从而提升训练稳定性。

20910

为什么ChatGPT能听懂你说的话？Embedding 技术揭秘

用户9574405 2026-04-142026-04-14 15:46:01

ChatGPT、Claude这些AI助手能理解我们说的话，还能给出像样的回答。做到这点，靠的是Embedding技术。

29710

第04期·Embedding向量化

巫山老妖 2026-04-132026-04-13 15:55:10

计算机只认识数字，不认识汉字或英文。所以在 AI 处理文本之前，需要把文字转换成数字——这个过程就叫 Embedding（向量化）。

29910

openclaw v2026.3.24 版本发布：从OpenAI模型与Embedding到Teams与Slack交互全链路体验与稳定性一次补齐

福大大架构师每日一题 2026-03-312026-03-31 21:30:59

openclaw于2026年3月25日正式发布v2026.3.24版本，本次更新聚焦OpenAI生态兼容、智能体工具能力、多平台交互体验、技能安装与管理、CLI...

68510

详解BERT模型的向量（Embedding）生成过程

索旭东 2026-03-312026-03-31 19:02:55

嵌入模型的终极目标，可以用一句话概括：让语义相似的输入，在向量空间中距离相近；让语义不同的输入，距离相远。

76310

#embedding

Embedding模型选型：OpenAI/BGE/M3E对比与私有化部署

目前仅此一家支持：向量索引加装前置过滤器

大模型-代数基础知识(向量，矩阵，点积)

如何判断“啥时候睡觉”和“几点休息”是同一个问题？一文搞懂向量搜索实战

VLM2Vec-V2：打破模态壁垒，迈向视频与文档理解的统一Embedding新纪元

深度解读 Qwen3 Embedding：从基础模型到SOTA文本Embedding与Reranker

RAG面试必问：Embedding模型到底怎么选？

Day9 学习日志：Embedding 与向量数据库

Day8 学习日志：CO-STAR 与「Embedding 课前知识储备」——Prompt、工具链与可观测性

大模型视频理解（Video Understanding）技术详解：从多模态 Embedding 到场景语义

换了 Embedding 模型向量全废了？Go 实战大规模数据平滑重构

无 Embedding、无向量数据库的 RAG 方法：PageIndex 技术解析

ESM3蛋白质语言模型cookbook（2）

多 Aspect Embedding：将上下文信号编入向量相似性计算的检索架构

言必称Embedding,Transformer的Embedding与RAG的Embedding是什么关系？傻傻搞不清。。。干货满满，专治各种懵懵懂懂！！！

Transformer灵魂1问：Embedding层的嵌入矩阵权重为什么要乘以sqrt(d_model)进行缩放？

为什么ChatGPT能听懂你说的话？Embedding 技术揭秘

第04期·Embedding向量化

openclaw v2026.3.24 版本发布：从OpenAI模型与Embedding到Teams与Slack交互全链路体验与稳定性一次补齐

详解BERT模型的向量（Embedding）生成过程

热门专栏

腾讯开源的专栏

张善友的专栏

腾讯技术工程官方号的专栏

AI科技大本营的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#embedding

Embedding模型选型：OpenAI/BGE/M3E对比与私有化部署

目前仅此一家支持：向量索引加装前置过滤器

大模型-代数基础知识(向量，矩阵，点积)

如何判断“啥时候睡觉”和“几点休息”是同一个问题？一文搞懂向量搜索实战

VLM2Vec-V2：打破模态壁垒，迈向视频与文档理解的统一Embedding新纪元

深度解读 Qwen3 Embedding：从基础模型到SOTA文本Embedding与Reranker

RAG面试必问：Embedding模型到底怎么选？

Day9 学习日志：Embedding 与向量数据库

Day8 学习日志：CO-STAR 与「Embedding 课前知识储备」——Prompt、工具链与可观测性

大模型视频理解（Video Understanding）技术详解：从多模态 Embedding 到场景语义

换了 Embedding 模型向量全废了？Go 实战大规模数据平滑重构

无 Embedding、无向量数据库的 RAG 方法：PageIndex 技术解析

ESM3蛋白质语言模型cookbook（2）

多 Aspect Embedding：将上下文信号编入向量相似性计算的检索架构

言必称Embedding,Transformer的Embedding与RAG的Embedding是什么关系？傻傻搞不清。。。干货满满，专治各种懵懵懂懂！！！

Transformer灵魂1问：Embedding层的嵌入矩阵权重为什么要乘以sqrt(d_model)进行缩放？

为什么ChatGPT能听懂你说的话？Embedding 技术揭秘

第04期·Embedding向量化

openclaw v2026.3.24 版本发布：从OpenAI模型与Embedding到Teams与Slack交互 全链路体验与稳定性一次补齐

详解BERT模型的向量（Embedding）生成过程

腾讯开源的专栏

张善友的专栏

腾讯技术工程官方号的专栏

AI科技大本营的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

openclaw v2026.3.24 版本发布：从OpenAI模型与Embedding到Teams与Slack交互全链路体验与稳定性一次补齐