暂无搜索历史
最近我用 WorkBuddy 做了一个很典型的业务自动化实践:给第三方知识库里的法规文件批量打标签。
“大模型蒸馏”可以把它理解为:用一个能力更强、更贵、更慢的大模型当老师,让一个更小、更便宜、更可控的模型学习它的回答方式、任务能力、推理风格和领域知识。
过去一年,Agent 被讨论得太多了。几乎所有技术文章和者公众号都在讲例如:ReAct、多 Agent 协作、Workflow、Tool Calling、MCP...
ChatBI 和智能问数已经很热了。大多数系统能把自然语言转成 SQL,甚至附上一段分析说明——但它们的终点,通常还只是"把数据查出来"。
该项目算是非常经典的金融业务用户画像的基础分析了,主要根据用户信用卡使用行为数据进行分析,根据收集到的不同字段信息,对每个用户划分类别。这里需要说明一下的是,聚...
2025年对我来说是充满挑战和收获的一年。这一年里,我聚焦于大模型应用落地与推理优化,从工程实践中总结经验。从提升大模型推理性能、调优OpenAI API参数,...
大规模Transformer模型的注意力机制在长序列情况下面临严重的计算和内存瓶颈:传统自注意力需执行级别的矩阵运算,并存储同规模的中间结果,频繁读写高带宽内存...
我是Fanstuck,致力于将复杂的技术知识以易懂的方式传递给读者,热衷于分享最新的行业动向和技术趋势。如果你对大模型的创新应用、AI技术发展以及实际落地实践感...
当大模型上下文长度突破 128K 甚至更高时,稀疏注意力(Sparse Attention)架构成为平衡性能与效果的关键。而这一切的基石,恰恰是底层算子的效率突...
在 AI 加速器 NPU 芯片生态中,CANN(Compute Architecture for Neural Networks)可以看作是连接“高层 AI...
听起来好像简单,但要是真的用一句话解释清楚 —— 很难。因为算子不是某个函数,也不是某段 Python 代码,它更像是深度学习世界里“最小执行单元”的一种抽象。
在如今的大模型部署世界里,大家讨论得最多的往往是模型本身:参数规模、上下文长度、推理速度、吞吐表现……但只要真正踩过一次从“模型参数”到“实际落地推理服务”的坑...
如果不是亲自测一遍,我真的不会相信:一个国产编程模型,居然能做到“看着设计稿直接写代码”。但这次参与 Doubao-Seed-Code 的定向评测,让我第一次意...
在没有好用的AI之前参加过数学建模竞赛的人,应该都经历过那种凌晨三点的绝望时刻;电脑散热像风扇,代码不停报错,论文还只有目录;队友一边说“我们还有时间”,可模型...
在技术人的世界里,“写代码”是起点,但“重构代码”才是成长的开始。 写一个能跑起来的项目并不难,尤其在开源社区里,快速验证想法、实现功能是最常见的节奏。但当...
我是 Fanstuck,一路以来,我持续输出了多个系列文章,从《Prompt工程零基础入门到精通》到《大模型微调全流程指南》,再到《DeepSeek+MCP 智...
我觉得用 “引领前沿” 来形容 2025 腾讯全球数字生态大会再合适不过。从大会披露的腾讯在大模型、智能体、AI 原生云等领域的最新科技突破就能看出,无论是混元 3D 3.0 生成模型的发布,还是智能体开发平台 3.0 版本实现近 600 项需求迭代,都展现出其在行业的前沿引领地位。在展示的多元场景落地应用里,从生活到办公,从营销到具身智能,都走在时代前列,为各行业数字化转型提供了新思路与新方法,引领着行业迈向智能化、国际化的新征程。期待腾讯未来能带来更多前沿创新成果!