首页
学习
活动
专区
圈层
工具
发布

#模型

FrankenPHP:PHP 的未来?

Tinywan

在这篇文章中,将介绍多年来 PHP 应用程序是如何被服务的——从经典的设置如 CGI、mod_php 和 PHP-FPM,到更新的选项如 Swoole、Road...

000

端侧 AI 的推理加速:手机端大模型怎么提速?

七牛开发者

这和 speculative decoding 的实现思路有点像。一般来说,生成 N 个 token 需要大模型跑 N 次;speculative decodi...

4710

GPT-5.6三款模型发布:AI可以自己跑任务了

袁锐钦

这个三档设计跟之前的「只有一个最强模型」完全不同。它不是让所有人都去用最贵的那个——是让不同场景用不同模型,按需按预算选。

3700

DeepSeek开源DSpark:推理速度提升85%

袁锐钦

草稿质量更高:传统的推测解码,小模型草稿经常打偏,大模型校验完发现大半要重写——白忙一场。DSpark在一个并行主干网上加了轻量级顺序模块,让草稿的上下文更连贯...

27820

你的 AI 为什么总落不了地?腾讯云 DataBuddy 用 DIOps 给了一种解法

腾讯云大数据

过去一年,几乎所有企业都在推进 AI 试点:客服、营销、风控、投研、供应链、运维……Demo 做得越来越快,模型效果也越来越惊艳。但到了真正的生产环境,很多项目...

6610

一周七条重磅,2026年下半场AI竞争的三条主线已经画好了

袁锐钦

判断:GPT-5.6是OpenAI「六周迭代」的兑现(5.4→3月、5.5→4月、5.6→6月)。三个分层模型的策略是在回应Anthropic的Claude系列...

8510

一个 Google 开源的 AI 开发框架,6K star,太实用了。

cxuanAI

它想处理的不是单次模型调用,而是一个 AI 功能从开发、调试、评测到上线后的观察。

6900

逃离Scaling Law的魔咒:接替Transformer的下一代推理范式「循环架构」全景拆解

赛博解生

大家好,我是赛博解生酱。在当前的人工智能浪潮中,基于Transformer架构的大语言模型(LLMs)无疑是绝对的霸主。通过“更大参数规模、更多训练数据、更长上...

4010

梁文锋亲自署名!DeepSeek发布DSpark,大模型推理一口气提速85%

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

这不是一个新模型。DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非全新架构,而是在原有模型基础上引入了推测解码...

22110

LoRA的遗忘曲线 vs RAG的多跳衰减:谁先触达准确率地板

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

从 LoRA 训练成本到向量检索延迟,一次 Fine-tuning vs RAG 的对账

5410

大模型-代数基础知识(向量,矩阵,点积)

码农戏码

只有大小概念,没有方向的概念。通过一个具体的数值就能表达完整。比如:重量、温度、长度、提及、时间、热量等都数据标量

4200

DreamX-World 1.0 把视频变成一个可以玩的世界

唐国梁Tommy

为了实时流式生成,论文把双向视频模型蒸馏成几步就能出图的自回归模型:用 causal forcing、DMD 式蒸馏,再加长序列 rollout 训练。关键一招...

4810

Codex-定价

Rookie

第四,常规任务换小模型。 官方明说「换成 GPT-5.4 或 GPT-5.4-mini 能延长你的本地消息限额」。结合 04 节那张表——小模型同档限额翻好几倍...

11410

什么是Codex

Rookie

Codex,名字听着是不是很耳熟?OpenAI 几年前就有个叫 Codex 的老模型,打开它官网一看更懵——怎么又是桌面 App、又是命令行、又是浏览器插件、还...

7910

动态网络贝叶斯预测融合:趋势预测与结构机制解析

CreateAMind

Bayesian Predictive Synthesis for Dynamic Networks:Forecasting and Identifying S...

5110

论测量、超决定论、自由意志与语境性

CreateAMind

On measurement, superdeterminism, free will,and contextuality

4200

神经元会说话吗?单细胞分辨率下的视觉语义叙述

CreateAMind

Semantic narration of vision at single-cell resolution

4100

有了 AI 之后公司变强了吗?

春哥大魔王

AI 马太效应更加明显,最好的模型拿走更大的市场,哪怕你在拥抱 AI,你不是最好的那个模型拥有者,你也不会变强。

4100

在 Langfuse 上配 LLM-as-Judge,五个真坑我替你踩过了

windealli

Langfuse 的在线评测核心是 LLM-as-Judge——也就是用一个大模型当裁判,来看你 Agent 的输出并打分。裁判自己也是个 LLM,所以你得先把...

5310
领券