首页
学习
活动
专区
圈层
工具
发布
首页标签NLP技术

#NLP技术

全面综合、开箱即用的 NLP 能力

基于spaCy和Prodigy的NLP迁移学习实践

用户11764306

迁移学习被称为“NLP领域的ImageNet时刻”。近期研究表明,模型可以利用从海量数据样本中提取的详细、具备上下文感知的语言知识进行初始化。本演讲将解释spa...

4810

spaCy v3.5新增模糊匹配与CLI命令

用户11764306

spaCy自然语言处理库发布v3.5版本。该版本引入了三个新的CLI命令、增加了模糊匹配功能、改进了实体链接功能,并包含一系列语言更新和错误修复。

7510

AI搜索算法:原理、类型与应用解析

用户11764306

AI搜索算法是理解自然语言查询并通过评估索引数据和文档来查找相关结果的方法。它通过探索一组潜在解决方案,为所给查询找到最佳答案或解决方案。

11110

将LLM融入实际NLP工作流

用户11764306

在本次演讲中,将展示GPT-3等大语言模型如何作为现有机器学习工作流的补充,而非替代。初始标注通过零样本或少样本学习从某机构的API获取,然后由人类决策者使用标...

8010

什么是大模型推荐的成本控制与推理加速?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

13910

怎么用大模型生成推荐的训练数据?Data Augmentation怎么做?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

15910

什么是大模型多轮对话式推荐?如何维护对话上下文?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

17210

什么是连续特征离散化?分桶(Bucketing)有什么技巧?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

10510

什么是用户短期兴趣和长期兴趣建模?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

11210

Healthsea:基于spaCy的补剂效果分析管道

用户11764306

利用机器学习和自然语言处理创造更好的健康获取方式。本文介绍了Healthsea的开发历程,这是一个端到端的spaCy管道,用于分析用户对补充产品的评论并提取其对...

6810

卫报如何用NLP实现引用抽取与模块化新闻

用户11764306

本文介绍了媒体公司如何利用自然语言处理(NLP)和信息抽取(IE)技术,将长文内容模块化为可复用的元素(如播客、信息图或博客),这一趋势被称为模块化新闻学。卫报...

11810

什么是信息茧房?推荐系统怎么平衡个性化和多样性?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

24810

什么是RAG文档切分策略?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

28620

什么是Semantic Chunking?与固定长度切分有什么区别?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

9910

知识融合(Knowledge Fusion)是什么?多个知识源怎么整合?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

18610

什么是上下文压缩?如何减少Token消耗?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

47710
领券