首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏苏三说技术

    零成本调用Qwen3.6无限Token,保姆级教程

    Qwen3.6也是一样,模型内部有256个“专家”,路由器根据输入内容智能选择最相关的几个专家来处理,实际运算量只相当于一个30亿参数的小模型。 这意味着什么? Qwen3.5-27B; 在NL2Repo端到端代码仓库生成任务上,Qwen3.6的29.4分远超Qwen3.5-35B-A3B的20.5分。 据官方披露,Qwen3.6模型原生支持多模态,能够感知和理解图像输入,并且支持非思考模式的快速响应,是目前最具通用性的开源模型之一。 场景三:多语言客服机器人 基于Qwen3.6的多语言支持,可以构建自动化的客服应答系统,7×24小时处理用户咨询,节省大量人力成本。 Qwen3.6在NL2Repo这类结构化任务上的表现极其优秀。

    48810编辑于 2026-06-09
  • 来自专栏福大大架构师每日一题

    LlamaFactory v0.9.5 发布:Qwen3.5/Qwen3.6/Gemma4 全面支持,Transformers v5 兼容性正式到位

    从这次更新说明来看,v0.9.5 的核心方向非常明确:新增对 Qwen3.5、Qwen3.6、Gemma4 的主力支持,并完成对 Transformers v5 的兼容适配。 1、版本核心亮点:Qwen3.5 / Qwen3.6 / Gemma4 + Transformers v5 v0.9.5 最醒目的升级,就是在版本标题中直接点明了两件事: • Added primary 尤其是 Qwen3.5 和 Qwen3.6,这次不仅是“支持”,而是围绕模板、视觉模块、projector 路径、packing、FlashAttention、NPU、Liger Kernel、文档等多个层面进行了完善 3、围绕 Qwen3.5 / Qwen3.6 的重点适配非常密集 如果把本次更新按模型聚焦来看,Qwen3.5 无疑是最重要的适配对象之一。 与 Qwen3.5 / Qwen3.6 直接相关的更新包括: • Adapt Qwen3.5 • register visual part for Qwen3.5 • support Qwen3.5 all

    37610编辑于 2026-06-02
  • 来自专栏AI

    Qoder 发布社区版:BYOK免费了

    这次首发支持的五家模型提供商,简直是国产大模型的"半壁江山":提供商特色标签适合场景阿里云百炼全家桶+Qwen3.6企业级稳定输出智谱AI代码+长程Agent复杂任务拆解深求智能开源+性价比学生党/实验项目 你可以用Qwen3.6写高并发服务,用DeepSeek做算法实验,用Kimi读技术文档——工具是死的,但组合方式是活的。

    1.5K10编辑于 2026-05-07
  • 来自专栏机器学习与统计学

    你的电脑能不能跑大模型?这个本地测评神器,直接给答案

    之前写本地部署相关的文章 Qwen3.6 MTP加速,本地部署加速1.5倍,驱动 Claude Code DeepSeek-V4 蒸馏 Qwen3.5,只有 9B,本地能跑 Unsloth 给 Qwen3.6 benchmark Qwen3.6-35B-A3B-UD-Q2_K_XL.gguf / raw harness Overall 85.7,RTX 4080,154.7 tok/s,Full benchmark qwen3.6

    24310编辑于 2026-05-19
  • 来自专栏机器学习与统计学

    Qwen3.6-27B 量化版本推荐,本地部署

    vLLM 到 Mac 本地、到消费级显卡,各种部署场景都能找到对应的版本 本文推荐几个 Qwen3.6-27B 量化版本,以及本地部署教程 第一路:vLLM 服务端部署 生产环境的首选,兼顾速度和并发,Qwen3.6 K_XL,24GB RAM 或者 Mac 设备都能流畅跑 ⚠️ 两个关键坑位(Unsloth 官方文档明确提醒): 不要用 CUDA 13.2,会输出乱码,NVIDIA 正在修 目前 Ollama 跑不了 Qwen3.6 non-thinking + temp=1.0,别搞混 Ollama 暂时跑不了,等 Ollama 适配 mmproj 分离结构 下篇文章咱们聊聊 Qwen3.6-27B 的另一个神奇版本,推理风格有大变化 #Qwen3.6

    10.4K20编辑于 2026-04-24
  • 来自专栏机器学习与统计学

    英伟达加速版 Qwen3.6-35B,双4090本地部署,性能实测

    Qwen3.6 用了 Gated DeltaNet(一种线性注意力变体),vLLM 对这类层的缓存机制还在打磨中 Custom AllReduce 被禁用:因为 GPU 之间不支持 P2P 直连,退回到 0.8, top_k=20, presence_penalty=1.5 Agent 场景推荐开启 preserve_thinking,能在多轮对话中保留思维链上下文,减少重复推理的 token 消耗 #Qwen3.6

    2.3K10编辑于 2026-04-24
  • 阿里Qwen3.6-27B实测

    这是一款270亿参数的稠密多模态模型,也是Qwen3.6系列目前唯一的稠密架构开源版本。 值得注意的是,同为Qwen3.6系列的35B-A3B(MoE,68.1%)与27B(稠密,68.8%)在中文综合评分上接近,差异主要体现在架构选择和具体任务类型上。

    1.5K20编辑于 2026-05-06
  • 来自专栏CodeGuide | 程序员编码指南

    AI + Draw.io + PPT,拿去直接部署,解放你的双手!

    我有深度测试,qwen3.6:35b 绘制出来的 draw.io/ppt 完全没问题。所以,像是个人或者公司有点点能力部署下本地 ollama 内部自己做一些绘图或者写代码(轻量一些的)完全可以。 如图,使用的是 qwen3.6:35b 绘制出来的,也还不错。 4. ppt 绘制 ppt 操作是小傅哥本次在 ai + draw.io 的智能体项目中,新增加的内容。后续还会陆续迭代其他场景。

    17310编辑于 2026-06-08
  • 4月国内外十款新发布AI模型 参数和价格对比

    /35ClaudeOpus4.7$5$25未公开与Opus4.6持平ClaudeOpus4.6$5$25未公开基准价格Gemini3.1pro未公开未公开未公开加量不加价策略关键指标:上下文长度竞争:Qwen3.6

    1.4K00编辑于 2026-04-26
  • 来自专栏代码日志

    日报|GPT6即将来临;Anthropic 4亿美元收购生物科技公司;DeepSeek V4:全面转向华为昇腾芯片

    Qwen3.6 Plus以4.6万亿Token登顶全球第一,DeepSeek V3紧随其后。 中国崛起:连续5周超越美国,Qwen3.6登顶全球。国产大模型不仅站稳脚跟,还开始领跑。但算力、芯片等基础设施仍是关键瓶颈。 3. 涨价时代:Token调用量暴增,成本压力显现。

    1.7K10编辑于 2026-04-09
  • 来自专栏机器学习与统计学

    Qwen3.6-35B 量化版,vLLM本地部署,性能实测

    内网其他业务系统也能用到 我之前部署了 Qwen3.5-35B 的这个量化版本,vLLM 0.17 部署它很完美 关闭思考之后的性能测试,单并发可以到 148Token/s PS:以下测试均为关闭思考后的结果 Qwen3.6

    5.2K10编辑于 2026-04-24
  • 来自专栏机器学习与统计学

    Claude Opus 蒸馏 Qwen3.6-27B,v2 来了

    作者还开源了一套针对 Qwen 系列 Multi-Token Prediction (MTP) heads 的拆分合并方法,带 MTP 头的 Qwopus3.6-27B-v2-MTP 版本,比官方 Qwen3.6 推理速度 快 1.66x,相当赞 Unsloth 给 Qwen3.6 上了MTP,本地推理速度起飞,消费级显卡轻松跑 训练数据来自哪里?

    67010编辑于 2026-05-26
  • 来自专栏仙踪·智能助手

    实测对比:OpenClaw vs Hermes,176个文件批量下载,谁更靠谱?

    还有个有意思的点:两个工具用各自的本地模型(Gemma4和Qwen3.6)都没跑通。这说明在复杂任务场景下,云端大模型的工具调用能力目前还是比本地模型成熟。

    15210编辑于 2026-05-20
  • 来自专栏仙踪·智能助手

    刚发布的 Gemma4 12B 能打吗?三款最新顶流开源模型跑分全解读,堪比跟去年主流闭源模型

    /3B85.286.092.773.4ClaudeSonnet4闭源85.4(标准MMLU)70.033.172.7GPT-4.1闭源90.2(标准MMLU)66.348.1(2024版)54.6注:Qwen3.6

    2600编辑于 2026-06-13
  • 来自专栏机器学习与统计学

    MiniMax-M2.7 开源了,本地部署指南

    用例依然是阅读理解+svg 代码生成 + 审美 结果是比较跌眼睛的,甚至感觉有 Qwen3 的水平 与 GLM-5.1 半斤八两 GLM 5.1 开源了,Claude Opus 又被“碾压”了 它俩都远不及 Qwen3.6

    3.5K90编辑于 2026-04-13
  • 原创—从跑通不可能任务,到再提速50%的全参优化!你也可以这么设置: 4060 8G笔记本调通Qwen3.6-35B+c128k+agent tooling

    直到5月Qwen3.6稠密版27B、35B稀疏MoE架构先后开源,搭配同期扎堆上新的多款优质本地模型Gemma4全系列、新版DeepSeek-R1蒸馏一众高性价比选型,硬件门槛持续下探。 Qwen3.6内置的MTP头一次能预测多个token,跳过自回归步骤。但MTP模型文件大2GB、多了753个小张量,8GBVRAM塞不进去。

    24610编辑于 2026-06-07
  • 不同厂商的大模型 API 格式不一样,怎么统一调用?

    帮我分析这段代码的性能瓶颈"}],stream=True)#通义千问做中文创作——同一套代码,只改了modelresponse=client.chat.completions.create(model="qwen3.6

    15110编辑于 2026-06-03
  • Hermes Agent 三大进阶玩法:免费模型 + 美化界面 + 省 Token

    实际写法建议保留标准接口形式:展开代码语言:YAMLAI代码解释model:provider:ollamabase_url:http://127.0.0.1:11434/v1default:qwen3.6

    5.1K42编辑于 2026-04-27
  • 来自专栏福大大架构师每日一题

    ollama v0.24.0 更新:Codex App 正式接入、内置浏览器、评审模式与 MLX 采样器重构,带来哪些变化?

    面向本地使用、且没有 Ollama Cloud 订阅时的推荐 如果你希望本地使用,并且没有 Ollama Cloud 订阅,官方推荐: • nemotron-3-super • gemma4:31b • qwen3.6

    74210编辑于 2026-05-20
  • 干货!OpenRouter与OpenCode傻傻分不清?一文秒懂

    综合能力均衡,免费无额度限制 日常代码补全、通用需求开发、轻量项目调试 Qwen3 Coder 262K 代码生成专项优化,多语言编程能力突出,中文支持友好 全栈代码开发、多语言项目重构、编程学习辅助 Qwen3.6

    1.5K10编辑于 2026-04-17
领券