搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

腾讯混元：开源模型生图时间缩短75%！
先和大家汇报：开源不到一个月，腾讯混元文生图大模型（混元DiT模型）的Github Star数已达到2.1k，位于开源社区热门DiT模型前列！刚刚，腾讯混元针对文生图开源模型，发布一组「加速库」：实测显示，加速后的生图时间缩短75%、生图速度提升4倍，大幅提升模型运行效率。这也是业内首个由官方推出的加速库。为了提升开源模型易用性，我们还做了一些努力： //使用方式，更简单了现在，用户可以基于ComfyUI的图形化界面，使用腾讯混元文生图模型。（Hugging Face的Diffusers是知名的AI开源社区，也是调用各种主流文生图大模型的通用库，已成为当今文生图大模型使用的社区标准）（混元DiT文生图模型的Diffusers界面）腾讯正在持续投入开源大模型生态建设附腾讯混元文生图开源大模型（混元DiT模型）项目链接官网：https://dit.hunyuan.tencent.com/ 代码：https://github.com/Tencent/HunyuanDiT
89910编辑于 2024-06-06
来自专栏云探索
腾讯混元生图：开启AI智能绘画新时代
混元生图支持多轮生图和对话能力，这是许多其他生图技术所不具备的。用户可以在初始生成的图片基础上，通过自然语言描述进行进一步的调整和优化，实现更加灵活、个性化的图像生成。二、混元生图的显著优势（一）卓越的真实感呈现腾讯混元生图在真实感呈现方面表现卓越，能够生成极为逼真的人像、场景和自然景观，达到以假乱真的效果。当涉及到场景生成时，无论是繁华都市的喧嚣街景，还是宁静乡村的田园风光，混元生图都能将场景中的各种元素巧妙融合，营造出真实的氛围。在自然景观的生成上，混元生图更是展现出强大的实力。三、混元生图在线调试（一）调试平台与工具介绍腾讯云提供了一系列强大且便捷的平台和工具，助力开发者高效地进行混元生图的在线调试，其中腾讯云 API 平台和 API Inspector 尤为突出。广告公司可以利用混元生图快速生成各种广告素材，如广告海报、视频广告的分镜头脚本等，大大缩短了广告制作的周期，降低了制作成本。总结腾讯混元生图的出现，为开发者和用户打开了一扇通往无限创意的大门。
2.3K22编辑于 2025-03-11
腾讯混元大模型在行业应用中的技术探索混元生图实践
本文将围绕腾讯混元大模型的产品能力、行业应用实践及其在各领域中的落地案例，深入探讨其技术优势与应用价值。一、腾讯混元大模型的产品能力与技术原理腾讯混元大模型是一款具备超大参数规模的自然语言处理模型，依托腾讯云强大的计算资源和深厚的技术积累，能够提供多种语言理解和生成能力。混元大模型不仅能够理解上下文语境，生成准确的自然语言文本，还能够处理多轮对话、内容摘要、自动翻译等复杂任务。通过这些技术能力，混元大模型在多个业务场景中展现出了强大的通用性和扩展性。二、产品应用实践：混元大模型在实际业务中的价值在实际业务应用中，腾讯混元大模型展现了极高的灵活性。三、实践首先进入混元生图根据提示添加描述词，比如：来一个风景图选择推荐的风格，右面界面会提示画作生成中，大约30秒以后会生成一幅风景画可以看到，画的还是不错的，再来画一个中秋节相关的操作非常简单四、总结
65610编辑于 2024-09-13
来自专栏腾讯云智能·AI公有云
CodeBuddy × 混元生图实战：用 CLI Skill 一键出图
本文是「腾讯云混元生图CLI实践」系列第 2 篇（共 2 篇）：第 1 篇：《腾讯云 CLI × 混元生图实战：用一行命令生成图片》从零开始，在终端用腾讯云 CLI 调用混元生图接口——适合想理解底层原理其他 AI IDE 或 Agent 平台，均可参考本文思路接入腾讯云混元生图能力。详细环境配置步骤可以参考系列第 1 篇：《腾讯云CLI × 混元生图实战：用一行命令生成图片》 Step 1：安装 Skill 到项目将 TextToImage-CLI Skill 放到项目的 .codebuddy 小结 TextToImage-CLI Skill 将腾讯云混元生图的完整调用链封装成了一个开箱即用的斜杠命令。对于需要在开发过程中快速生成素材、原型图或灵感参考的场景，它是一个非常实用的效率工具。当生图变成开发流程中随手可用的"小工具"时，AI 生图才真正融入了日常生产力。
18811编辑于 2026-06-10
腾讯混元发布开源加速库，生图时间缩短75%
6月6日，腾讯发布针对腾讯混元文生图开源大模型（以下简称为混元DiT模型）的加速库，让推理效率大幅提升，生图时间缩短75%。混元DiT模型的使用门槛也大幅降低。用户可以基于ComfyUI的图形化界面，使用腾讯混元文生图模型能力。此前，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，可供企业与个人开发者免费商用。用户可以通过图像化工作流使用混元DiT文生图模型，实现与官方模型一样的效果。混元DiT文生图模型的ComfyUI使用界面此外，围绕ComfyUI的使用生态，还衍生出强大的开源社区。腾讯文生图负责人芦清林表示：“腾讯混元文生图模型开源之后得到了众多开发者的支持和反馈，我们十分高兴，也同时在针对开发者的反馈与社区一起完善和优化基于混元DiT的开源生态，让更多开发者能更便利地享受到最新的研究成果
52200编辑于 2024-06-26
来自专栏腾讯开源的专栏
腾讯混元发布开源加速库，生图时间缩短75%
6月6日，腾讯发布针对腾讯混元文生图开源大模型（以下简称为腾讯混元DiT模型）的加速库，让推理效率大幅提升，生图时间缩短75%。 //使用门槛，降低了腾讯混元DiT模型的使用门槛也大幅降低。用户可以基于ComfyUI的图形化界面，使用腾讯混元文生图模型能力。此前，腾讯宣布旗下的腾讯混元文生图大模型全面升级并对外开源，可供企业与个人开发者免费商用。 //生图速度，更快了项目组通过知识蒸馏和TensorRT高性能推理框架，实现了DiT模型的采样步数压缩与高效推理部署。蒸馏主要指降低扩散模型迭代的步数实现加速。用户可以通过图像化工作流使用腾讯混元DiT文生图模型，实现与官方模型一样的效果。腾讯混元DiT文生图模型的ComfyUI使用界面此外，围绕ComfyUI的使用生态，还衍生出强大的开源社区。
65810编辑于 2024-06-13
评测腾讯混元大模型，python调用混元生文接口
想丰富腾讯混元python sdk 调用混元大模型的实例。下面介绍python实现混元生文接口ChatCompletions实例。示例三多轮问答中调用查询天气工具时，混元大模型回答的有问题。
1.8K20编辑于 2024-09-13
来自专栏Arya好奇猫
玩转腾讯混元 | 腾讯混元大模型AIGC使用指南以及混元生文体验
使用指南进入活动页面，然后选择专属优惠套餐服务选择混元生文混元生文使用体验基础模型体验写一篇日记根据下面的故事情节让大模型写日记：猫妈妈生了3只小猫，有个男孩欺负小猫，当时猫妈妈不在，应该是叼这另一只小猫去安全的地方了
66230编辑于 2024-10-18
腾讯混元图像3.0驱动：ima文生图与图生图能力及创作场景
摘要：腾讯混元图像3.0赋能ima，文生图强文字渲染，图生图上传照片即可生成写真、打卡图、宣传海报，创作场景一站覆盖一、文生图进入"文字不崩"时代做过设计的人都知道，AI文生图最让人崩溃的不是画面不够精致这个问题在腾讯混元图像3.0发布后，终于有了质的突破。 ima的文生图能力正是由混元图像3.0驱动，其核心优势之一就是强文字渲染。三、为什么是混元图像3.0？混元图像3.0之所以能实现强文字渲染，背后是模型架构的深度优化。五、图生图：上传照片即可生成写真、打卡图、宣传海报 2026年2月3日，ima正式接入混元图像3.0图生图模型。从促销海报到社交表情包，从家庭写真到房间布置预览，腾讯混元图像3.0驱动的ima文生图与图生图能力，正在让每一个不会设计的人也能快速产出专业级视觉内容。
16610编辑于 2026-06-11
来自专栏腾讯开源的专栏
给大模型生图“去油”，混元这个新研究火了
感谢大家的喜欢 ♥️ 腾讯混元生图团队最近发布的工作SRPO受到了社区的热烈欢迎，项目在9月10日发布之后登上了HuggingFace热度榜榜首，同时社区量化版本下载量达25K，Github Star 该工作主要提供了文生图模型的强化算法，解决了开源文生图模型Flux的皮肤质感“过油”的问题，能让人像真实感提升3倍，Flux是目前开源文生图社区中最广泛使用的基础模型。为了解决这个问题，腾讯混元团队联合香港中文大学（深圳）和清华大学近日提出创新性解决方案：语义相对偏好优化（Semantic Relative Preference Optimization）。 tencent.github.io/srpo-project-page/ GitHub：https://github.com/Tencent-Hunyuan/SRPO 加入微信群即可了解更多“腾讯开源新动态” #混元、#大模型、#文生图、#开源、#腾讯、
51310编辑于 2025-09-29
打字即出图！混元图像2.0让AI生图进入“零延迟”时
5月16日，腾讯混元推出Hunyuan Image2.0（混元图像2.0模型），基于超高压缩倍率的图像编解码器，全新扩散架构，实现超快的推理速度和超高质量图像生成，极大降低“AI味”。图：Hunyuan Image2.0在客观评测中超越同类图像生成竞品腾讯科技在第一时间进行了实测：1、文生图指令遵循的能力很强，能按照文字的改变，实时修改图片中的内容；2、图生图有“参考主体”、“参考轮廓 2、图像生成图像：可调节遵循强度除了文字直接生成图片，混元图像2.0也支持上传参考图，通过图生图。但是，和传统生图模型不同的是，混元图像2.0可以提取主体或轮廓特征，融合文本指令生成新图像。图：主体一致输出，从左第一张图表示主体图，后面依次是主体图权重从低到高对应的效果图通过图生图-参考主体这个功能，可以轻松给自己家宠物生成各种“整活儿”图片，比如上传一张猫咪照片，图像参考强度设定为92，同样，参考轮廓也可以设定参考的强度，比如下面的例子，左边第一张图表示边缘图，后面依次是轮廓图权重从低到高对应的效果图。专业画师的生产力工具实时文生图的功能，普通用户可以0门槛上手。
1.5K10编辑于 2025-05-21
「灵感瞬间」CodeBuddy+混元生图+lighthouse助我实现漫画插图在线生成
OK,轻量应用服务我们零元购了！会收到成功的通知。然后我们需要买一点混元生图的资源套餐。上述完成后，基本配置就完成了，下面我们进入开发对话！：基础参数：分辨率、风格等核心设置高级参数：种子值、Logo添加等专业选项扩展参数：负向提示词等实验性功能技术挑战与突破初始困境：API集成的复杂性项目开始时，我面临的最大技术瓶颈是腾讯云混元生图的突破性帮助：自动生成了完整的API签名算法实现提供了详细的参数映射和错误处理机制指导我从手动实现转向官方SDK集成根据官方提供的说明文档，我先借助CodeBuddy搭建了一套简易的框架，测试了一版混元生图
87821编辑于 2025-11-03
腾讯混元生3D产品概要
一、产品定位与核心亮点腾讯混元生3D 是基于腾讯自研大模型的AI 3D内容生成平台。其核心技术属性在于将传统的专业3D建模流程进行AI化重构，核心商业差异化卖点在于将传统需数天、成本数千元的建模工作压缩至“分钟级完成、成本仅数元”，旨在帮助企业实现极致的降本增效与业务创新。功能框架产品提供多元化的生成与处理能力，涵盖以下模块：生成类：文生3D、3D人物生成、草图生3D、组件生成、纹理生成。处理类：白模生成、智能拓扑、UV展开。 2. 解决方案：应用腾讯混元生3D技术。成效：原文未提供具体量化指标。 2. Lovart 背景：Lovart 属于泛互行业，定位为平台工具厂商。解决方案：应用AI技术能力。数据来源：<腾讯混元生3D产品手册>
15710编辑于 2026-06-01
来自专栏腾讯云智能·AI公有云
腾讯云CLI × 混元生图实战：用一行命令生成图片
本文是「腾讯云混元生图CLI实践」系列第 1 篇（共 2 篇）：第 1 篇（本文）：从零开始，在终端用腾讯云 CLI 调用混元生图接口——适合想理解底层原理、有脚本化/批量需求的开发者。第 2 篇：《CodeBuddy × 混元生图实战：用 CLI Skill 一键出图》结合CodeBuddy等平台，用 CLI Skill 一键生图，开箱即用——适合日常开发中快速出图。大多数人使用 AI 生图时，习惯打开 Web 控制台或第三方应用。 result_image.png','wb').write(base64.b64decode(data['ResultImage'])) " 解码完成后，打开 result_image.png，就能看到混元模型为你生成的画作了适用场景除了本文演示的单次生图，腾讯云CLI+混元生图的方式在以下场景同样适用：批量运营素材：电商大促需要 100+ 张商品主图/场景图，Shell 循环 + Prompt 文件批量出图； CI/CD
13610编辑于 2026-06-10
腾讯混元生3D产品概要
一、产品定位与核心亮点腾讯混元生3D是一款基于腾讯自研大模型的AI 3D内容生成平台。其核心商业差异化在于，能将传统需数天完成、成本数千元的专业3D建模工作，压缩至 “分钟级完成、成本仅数元”，旨在帮助企业实现极致降本增效与业务创新。三、应用框架和功能介绍功能框架产品提供多元化的生成模块，包括：文生3D 3D人物生成白模生成草图生3D 智能拓扑纹理生成组件生成 UV展开硬核指标建模精度：支持1536³分辨率、36
12510编辑于 2026-06-01
来自专栏Java项目实战
可灵平替 SkyReels: 混元升级版图生视频
SkyReels加上混元Video则可以实现图生视频的高精度视频和加速模型，并且实际测试的话，很低的分辨率就可以实现图生视频加上目前本地测试的时长也是完全可以接受的，而且测试的图生视频超级的清晰，不会出现扭曲 1.首先拖入工作流 2.下载对应的模型 a.官方的图生视频模型，相当于大模型，需要放在大模型unet的文件夹 b.对应的VAE,这里搭配的也是跟官方精度一致的混元F16 Vae，放在vae 长度需要看本地的显卡显存大小，虽然说是97帧，但是为了速度，我们缩小到50帧左右就可以，所以我给到了57帧，但是视频的帧率我给到了30帧，希望更清晰一点实际测试开了多个AI应用的前提下，846S完事，目前测试多图多次测试
1.4K10编辑于 2025-02-25
来自专栏腾讯开源的专栏
腾讯混元生图2.1开源！可写字、更高清、更一致、更可玩！
经过一段时间的打磨，昨天，我们带来了腾讯混元最新的生图模型“混元图像2.1（HunyuanImage 2.1）”。这是一个开源的文生图模型，支持原生2K生图，在多个方面达到业界领先水平： 01、在2.0架构的基础上全面升级，更加注重生成效果与性能之间的平衡，性能更强 02、不仅支持中英文的原生输入，还能够实现中英文文本与复杂语义的高质量生成另外，一个提前打听到的消息：混元原生多模态图像生成模型，也在路上了。先看看混元图像2.1都有什么东西。因此，模型能高效原生生成2K图。在文本编码方面，混元图像2.1配备了双文本编码器：一个MLLM模块用于进一步提升图文对齐能力，另一个ByT5模型则增强了文字生成表现力。腾讯混元在图像生成领域持续深耕，曾发布首个开源的中文原生DiT架构图像大模型——混元DiT，以及业界首个商用级实时生图模型——混元图像2.0。
1.3K10编辑于 2025-09-11
来自专栏腾讯云智能·AI公有云
腾讯混元图生视频模型已上线，企业用户可申请腾讯云API接入
腾讯混元图生视频模型目前已经上线，企业和开发者可在腾讯云申请使用API接口；用户通过混元AI视频官网即可体验。混元视频生成开源模型目前在Github、HuggingFace等主流开发者社区均可下载体验。腾讯混元发布图生视频模型并对外开源，同时上线对口型与动作驱动等玩法，并支持生成背景音效及2K高质量视频。基于图生视频的能力，用户只需上传一张图片，并简短描述希望画面如何运动、镜头如何调度等，混元即可按要求让图片动起来，变成5秒的短视频，还能自动配上背景音效。捏扁特效LoRA模型混元开源技术报告披露，混元视频生成模型具备灵活的扩展性，图生视频和文生视频在相同的数据集上开展预训练工作。混元图生视频模型目前已经在腾讯云上线，企业和开发者可扫描下方二维码或点击【阅读原文】申请使用API接口。
2K10编辑于 2025-03-17
腾讯混元文生图大模型全面开源！
和大家汇报：刚刚，腾讯混元文生图大模型，全面升级并对外开源！作为业内首个中文原生的DiT架构开源模型，腾讯混元文生图支持中英文双语输入及理解。除直接用于文生图，也可作为视频等多模态视觉生成的基础。去年7月，腾讯混元文生图团队就明确了基于DiT架构的模型方向。（DiT是基于Transformer的扩散模型架构，是Sora、Stable Diffusion 3 也选用的关键技术。）今年初，腾讯混元文生图完成了模型架构的全面升级，相比上一代整体效果提升超过20%。中文原生的腾讯混元文生图，母语就是中文：通过对汉语字符系统、文化内涵的深度学习，对国风元素和中文复杂性有更深刻的理解。 //全面开源目前，腾讯混元文生图大模型已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型。不管是企业还是个人开发者，全部免费可用。
1.1K10编辑于 2024-05-14
来自专栏腾讯开源的专栏
腾讯混元视频生成再升级，发布图生视频、音频与动作驱动等能力
腾讯混元图生视频模型目前已经上线，企业和开发者可在腾讯云申请使用API接口；用户通过混元AI视频官网即可体验。混元视频生成开源模型目前在Github、HuggingFace等主流开发者社区均可下载体验。腾讯混元发布图生视频模型并对外开源，同时上线对口型与动作驱动等玩法，并支持生成背景音效及2K高质量视频。基于图生视频的能力，用户只需上传一张图片，并简短描述希望画面如何运动、镜头如何调度等，混元即可按要求让图片动起来，变成5秒的短视频，还能自动配上背景音效。混元开源技术报告披露，混元视频生成模型具备灵活的扩展性，图生视频和文生视频在相同的数据集上开展预训练工作。混元图生视频模型目前已经在腾讯云上线，企业和开发者可扫描下方二维码或点击【阅读原文】申请使用API接口。
1.9K10编辑于 2025-03-07

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

腾讯混元：开源模型生图时间缩短75%！

腾讯混元生图：开启AI智能绘画新时代

腾讯混元大模型在行业应用中的技术探索混元生图实践

CodeBuddy × 混元生图实战：用 CLI Skill 一键出图

腾讯混元发布开源加速库，生图时间缩短75%

腾讯混元发布开源加速库，生图时间缩短75%

评测腾讯混元大模型，python调用混元生文接口

玩转腾讯混元 | 腾讯混元大模型AIGC使用指南以及混元生文体验

腾讯混元图像3.0驱动：ima文生图与图生图能力及创作场景

给大模型生图“去油”，混元这个新研究火了

打字即出图！混元图像2.0让AI生图进入“零延迟”时

「灵感瞬间」CodeBuddy+混元生图+lighthouse助我实现漫画插图在线生成

腾讯混元生3D产品概要

腾讯云CLI × 混元生图实战：用一行命令生成图片

腾讯混元生3D产品概要

可灵平替 SkyReels: 混元升级版图生视频

腾讯混元生图2.1开源！可写字、更高清、更一致、更可玩！

腾讯混元图生视频模型已上线，企业用户可申请腾讯云API接入

腾讯混元文生图大模型全面开源！

腾讯混元视频生成再升级，发布图生视频、音频与动作驱动等能力

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

腾讯混元：开源模型生图时间缩短75%！

腾讯混元生图：开启AI智能绘画新时代

腾讯混元大模型在行业应用中的技术探索混元生图实践

CodeBuddy × 混元生图实战：用 CLI Skill 一键出图

腾讯混元发布开源加速库，生图时间缩短75%

腾讯混元发布开源加速库，生图时间缩短75%

评测腾讯混元大模型，python调用混元生文接口

玩转腾讯混元 | 腾讯混元大模型AIGC使用指南 以及 混元生文体验

腾讯混元图像3.0驱动：ima文生图与图生图能力及创作场景

给大模型生图“去油”，混元这个新研究火了

打字即出图！混元图像2.0让AI生图进入“零延迟”时

「灵感瞬间」CodeBuddy+混元生图+lighthouse助我实现漫画插图在线生成

腾讯混元生3D产品概要

腾讯云CLI × 混元生图实战：用一行命令生成图片

腾讯混元生3D产品概要

可灵平替 SkyReels: 混元升级版 图生视频

腾讯混元生图2.1开源！可写字、更高清、更一致、更可玩！

腾讯混元图生视频模型已上线，企业用户可申请腾讯云API接入

腾讯混元文生图大模型全面开源！

腾讯混元视频生成再升级，发布图生视频、音频与动作驱动等能力

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

玩转腾讯混元 | 腾讯混元大模型AIGC使用指南以及混元生文体验

可灵平替 SkyReels: 混元升级版图生视频