
AI大模型、Anthropic、Mythos模型、Oceanus、Claude竞品、GPT-5.6、Gemini 3.5 Pro、红队测试、AI模型定价、LLM最新消息
大家好 这里是「代码简单说」`,欢迎大家关注同名公众号,不定时更新更多实用有趣的教程 也欢迎大家在评论区一起讨论交流!~
最近 AI 圈又传出一条重磅消息。

就在不少开发者还在关注 GPT-5.6 和 Gemini 3.5 Pro 动向的时候,Anthropic 新一代 Mythos 模型的相关信息突然被曝光。
根据海外社区爆料,一个内部代号为 Oceanus 的模型版本已经开始进行红队测试。从目前流出的信息来看,新版本 Mythos 不仅性能相比 Preview 版本有所提升,其定价策略也已经提前曝光。
对于经常接触 Claude、GPT、Gemini 等大模型 API 的开发者来说,这次消息值得重点关注。
根据海外消息源透露:
Anthropic 正在测试 Mythos 系列的新模型版本。
内部测试代号为:
Oceanus相关爆料最早来自 X 平台用户:
@synthwavedd其表示:
Oceanus 版本性能已经超过此前 Mythos Preview。
同时还曝光了一张疑似内部测试截图。

从目前已知信息来看,Oceanus 并不是一个独立模型,而更像是 Mythos 的一个重要版本检查点(Checkpoint)。
很多开发者看到「红队测试」可能比较陌生。
实际上大型 AI 模型在正式发布之前,通常都会经历一个重要阶段:
Red Team Testing即:
红队测试其核心目的是:
简单来说:
开发团队负责构建模型。
红队则负责想办法“搞坏模型”。
例如:
诱导违规回答
绕过限制
提示词注入攻击
角色越权
系统Prompt泄露如果模型能经受住这些攻击,才有资格进入正式发布阶段。
根据爆料信息显示:
Oceanus 已于:
2026年6月5日向部分红队测试成员开放。
业内通常有一个规律:
阶段 | 时间 |
|---|---|
红队测试启动 | T |
正式发布 | T+7天左右 |
不少大模型都遵循类似节奏。
例如:
因此部分业内人士推测:
Oceanus 有可能在未来一周内正式亮相。
当然,目前还没有任何官方确认信息。
不过事情并没有完全按照计划进行。
有消息称:
部分测试账号权限被第三方转售。
具体表现为:
测试访问权限
↓
API代理
↓
第三方付费调用据称 Anthropic 已经发现相关行为,并进行了紧急处理。
目前流出的说法是:
红队测试被暂时中断但这一消息尚未得到官方确认。
除了性能之外。
开发者最关注的往往是:
API价格此次爆料中还包含了 Mythos 新版本的预计定价。
类型 | 价格 |
|---|---|
Input Token | 16美元/百万Token |
Output Token | 80美元/百万Token |
换算后:
100万Token = 16美元约合:
1美元 ≈ 62500 Token100万Token = 80美元约合:
1美元 ≈ 12500 Token可以看到:
输出价格明显高于输入价格。
这也是目前主流大模型的常见策略。
从市场定位来看,Mythos 很可能瞄准高端推理市场。
下面做一个简单对比:
模型 | 输入价格 | 输出价格 |
|---|---|---|
GPT系列高端模型 | 较高 | 较高 |
Gemini 3.5 Pro | 中高 | 中高 |
Claude系列 | 中高 | 高 |
Mythos(传闻) | 16美元 | 80美元 |
从价格区间来看:
Oceanus 并不属于低价竞争路线。
更像是:
高性能优先
企业级市场的产品定位。
如果爆料内容属实。
那么 Mythos 将会形成新的竞争格局。
目前 GPT-5.6 预计也将在近期迎来更新。
如果两者发布时间接近:
GPT-5.6
VS
Mythos Oceanus可能会成为下半年 AI 圈的重要竞争焦点。
Gemini 3.5 Pro 目前在:
方面表现较强。
而 Mythos 若能在推理能力上进一步提升,则可能争夺企业客户和开发者市场。
对于普通开发者而言,当前最值得关注的是三个方面:
很多模型发布前宣传非常强。
真正上线后:
代码能力
数学能力
Agent能力
工具调用才是决定竞争力的关键。
企业级项目更关注:
而不是单纯跑分。
对于大规模应用来说:
即使模型能力提升 10%。
如果成本增加 50%。
很多企业也不会轻易迁移。
因此最终胜负仍然取决于:
性能 / 成本比目前曝光的信息显示:
不过需要注意的是:
截至目前,上述内容均来自社区爆料和测试人员消息,Anthropic 官方尚未发布正式公告。
Oceanus 是否会按计划上线、最终价格是否调整、实际性能能否达到预期,仍需等待后续官方信息确认。
对于关注 AI 大模型生态的开发者来说,这无疑是近期最值得持续跟踪的消息之一。