首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

别再问“AI会不会取代我”:用这张表每周自测你的不可替代性

jack.yang

2026年的职场空气里,弥漫着一种比2018年中台泡沫期更粘稠的焦虑。那时我们担心的是组织架构调整、岗位合并;如今我们恐惧的是物种层面的替代。每当大模型发布新版...

7420

解密 MCP 协议:为什么说它是 Anthropic 甩给 OpenAI 最狠的一击?

鱼片粥来碗豆腐

在开源与闭源、生态与壁垒的博弈中,AI 行业迎来了一个里程碑式的转折点。如果说 2024 年底 Anthropic 发布的 MCP(Model Context ...

2600

大模型基石 AI 分布式存储工程实战(完结)

97it

2024-2026年,大模型参数规模每6个月翻一倍。但很少有人注意到一个更狠的事实:

9410

大模型分布式训练并行策略详解,租赁多机集群训练提速实操

用户12553867

百亿、千亿参数大模型无法在单张显卡完成完整训练,分布式并行训练成为行业标准工程方案。自研机房搭建多机集群存在硬件采购、机房运维、算力闲置成本高三大痛点,国内多数...

7710

缓存、批处理、降级:压住大模型 API 账单的三板斧实战复盘

用户3993654

第一季度我们的大模型 API 账单环比涨了 70%,而业务量只涨了 30%——多出来的 40%,全是工程上的浪费。花了一个月做调用侧治理,账单回落到比治理前低两...

5400

qKnow智能体构建平台专业版插件中心架构重构设计预告:三层一体化设计与全生命周期管理

吴同

随着平台客户规模持续扩大、插件类型日益丰富,现有插件管理模块在功能深度、信息组织与扩展性方面已难以承载后续业务演进需求。

6710

缓存、批处理、降级:压住大模型 API 账单的三板斧实战复盘

用户3993654

第一季度我们的大模型 API 账单环比涨了 70%,而业务量只涨了 30%——多出来的 40%,全是工程上的浪费。花了一个月做调用侧治理,账单回落到比治理前低两...

7000

DeepSeek完成500亿融资,估值超3300亿,如何解读背后的估值逻辑?将对AI领域产生哪些影响?

鱼片粥来碗豆腐

最近,DeepSeek完成约500亿元融资、估值超过3300亿元人民币的消息,引发了整个科技圈和资本市场的广泛关注。如果这一融资规模和估值最终得到确认,那么它不...

1600

2026毕业季残酷真相:不会用AI Agent的人,正在被“一人公司”淘汰

jack.yang

2026年6月,又一批千万级规模的毕业生涌入就业市场。但与往年不同的是,今年的求职者在面试桌对面遇到的,往往不再是庞大的HR团队或部门主管,而是一个个看似单薄、...

23610

AI Agent泄露客户数据?Dify安全网关实测:2026年企业上AI的最后一条红线

jack.yang

2026年,AI Agent已从概念验证走向核心业务深水区。然而,随着Agent自主决策能力的指数级增长,传统API网关与静态数据防泄漏(DLP)策略在面对“非...

12020

Gemini插件工程指南:从Extensions到Agent工作流扩展实践

霖川

大模型的价值拐点,早已从“参数规模的内卷”转移到了“外部工具链的集成”。当开发者试图将 Gemini 2.5 Pro 从单纯的“对话引擎”升级为能执行复杂业务的...

10210

主流并行策略选型+集群实操:低成本租赁大模型训练提速方案

用户12553867

当前7B-175B参数主流大模型单机显存、算力无法满足全量预训练需求,行业通用解决方案为多机分布式并行训练。自研自建GPU/NPU集群存在硬件采购周期45-90...

7510

Mac本地模型接入MLX怎么测

用户3825620

这次更新真正解决的麻烦,是 Mac 用户本地跑大模型时经常遇到的三件事:回答慢、内存吃紧、输出质量不稳定。本地模型运行工具这次在 Apple Silicon 上...

9610
领券