首页
学习
活动
专区
圈层
工具
发布

#gpt

2026实测解析:GPT-5.5模型能力详解与国内合规使用规范

用户12530479

随着AI大模型技术持续迭代,2026年GPT-5.5凭借升级的多模态精细化处理能力,成为职场办公、图文整编、代码开发、数据优化的核心生产力工具。本次实测数据与体...

17210

2026双模型深度横评!GPT-5.5对决Gemini 3.1 Pro,职场开发选型不踩坑

用户12530479

当下主流AI模型迭代速度极快,很多开发者、职场从业者都陷入了选型难题。到底是新版本GPT-5.5综合实力更强,还是Gemini 3.1 Pro更适配落地场景?单...

17110

从零跑通文本知识蒸馏:GPT-2 XL → GPT-2 Small 全流程实战

Gardian

摘要:本文记录在一次 RTX 4090 D (24GB) 本地环境下,从零搭建并跑通文本知识蒸馏(Knowledge Distillation)完整流程的全过程...

9910

手撕 GPT#09:验证 loss 从 340 降到 6.5,模型却只会说“对对对”——小模型蒸馏的“不可能三角”

烟雨平生

手撕 GPT 系列第 9 篇。前 8 篇我们训练了一个 3M 模型,发现天花板在容量。上一篇最后选了知识蒸馏这条路——让大模型教小模型。

8210

手撕 GPT#08:你已经能训练模型了——接下来“撕”什么?

烟雨平生

走到这儿,你已经不零基础了。但你可能不确定自己到底学会了什么,也不知道接下来该往哪走。

8010

1.6万美元的人形机器人,具身智能的GPT-2.5时刻来了

老周聊架构

这是中国宇树科技(Unitree)G1 的价格。折合人民币约 11.6 万元,比一辆比亚迪秦还便宜。

15810

Claude Opus 4.8 vs GPT-5.5,到底该用谁?

程序视点

最近刷AI相关的新闻,满屏都是 laude Opus 4.8。我第一反应不是「又出新模型了」,而是:4.7 才出来多久啊?

35710

手撕 GPT#07:我试了四个方向终于摸到了3M模型的天花板,最后还是成功了

烟雨平生

手撕 GPT 系列第 7 篇。前 6 篇我们跑通了训练,模型通过了 6/6 验收。这篇记录的是:当我们试图让模型变得更好时,发现了什么。

9310

手撕 GPT#06:手把手 30 分钟:零基础跑通你的第一个 GPT

烟雨平生

问:什么是注意力机制? 答:注意力机制通过计算查询和键的相关性分配权重,让模型动态关注最相关的部分。 问:你是谁? 答:我是一个基于 Transformer...

12010

手撕 GPT#05:316 万个参数、比照片还小的AI,为什么还能学会“说”中文?

烟雨平生

但你可能注意到,我们的模型用了 GQA、SwiGLU、RMSNorm 这些词——它们不是原始论文里的东西。

15010

OpenMUSE 全面详解:非扩散Transformer文生图开源基座(对标GPT Image 2)

掘金安东尼

当前主流文生图模型(Stable Diffusion、DALL·E系列)均基于Diffusion扩散架构,普遍存在文字渲染崩坏、构图逻辑差、推理步骤多、上下文语...

16810
领券