首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 腾讯:开源模型时间缩短75%!

    先和大家汇报: 开源不到一个月,腾讯文生大模型(DiT模型)的Github Star数已达到2.1k,位于开源社区热门DiT模型前列! 刚刚,腾讯元针对文生开源模型,发布一组「加速库」: 实测显示,加速后的时间缩短75%、速度提升4倍,大幅提升模型运行效率。 这也是业内首个由官方推出的加速库。 为了提升开源模型易用性,我们还做了一些努力: //使用方式,更简单了 现在,用户可以基于ComfyUI的图形化界面,使用腾讯文生模型。 (Hugging Face的Diffusers是知名的AI开源社区,也是调用各种主流文生大模型的通用库,已成为当今文生大模型使用的社区标准) (DiT文生模型的Diffusers界面) 腾讯正在持续投入开源大模型生态建设 附腾讯文生开源大模型(DiT模型)项目链接 官网:https://dit.hunyuan.tencent.com/ 代码:https://github.com/Tencent/HunyuanDiT

    89910编辑于 2024-06-06
  • 来自专栏云探索

    腾讯:开启AI智能绘画新时代

    支持多轮和对话能力,这是许多其他技术所不具备的。用户可以在初始生成的图片基础上,通过自然语言描述进行进一步的调整和优化,实现更加灵活、个性化的图像生成。 二、的显著优势(一)卓越的真实感呈现腾讯在真实感呈现方面表现卓越,能够生成极为逼真的人像、场景和自然景观,达到以假乱真的效果。 当涉及到场景生成时,无论是繁华都市的喧嚣街景,还是宁静乡村的田园风光,都能将场景中的各种元素巧妙融合,营造出真实的氛围。在自然景观的生成上,更是展现出强大的实力。 三、在线调试(一)调试平台与工具介绍腾讯云提供了一系列强大且便捷的平台和工具,助力开发者高效地进行的在线调试,其中腾讯云 API 平台和 API Inspector 尤为突出。 广告公司可以利用快速生成各种广告素材,如广告海报、视频广告的分镜头脚本等,大大缩短了广告制作的周期,降低了制作成本。总结腾讯的出现,为开发者和用户打开了一扇通往无限创意的大门。

    2.3K22编辑于 2025-03-11
  • 腾讯大模型在行业应用中的技术探索实践

    本文将围绕腾讯大模型的产品能力、行业应用实践及其在各领域中的落地案例,深入探讨其技术优势与应用价值。 一、腾讯大模型的产品能力与技术原理 腾讯大模型是一款具备超大参数规模的自然语言处理模型,依托腾讯云强大的计算资源和深厚的技术积累,能够提供多种语言理解和生成能力。 大模型不仅能够理解上下文语境,生成准确的自然语言文本,还能够处理多轮对话、内容摘要、自动翻译等复杂任务。通过这些技术能力,大模型在多个业务场景中展现出了强大的通用性和扩展性。 二、产品应用实践:大模型在实际业务中的价值 在实际业务应用中,腾讯大模型展现了极高的灵活性。 三、实践首先进入根据提示添加描述词,比如:来一个风景选择推荐的风格,右面界面会提示画作生成中,大约30秒以后会生成一幅风景画可以看到,画的还是不错的,再来画一个中秋节相关的操作非常简单四、总结

    65610编辑于 2024-09-13
  • 来自专栏腾讯云智能·AI公有云

    CodeBuddy × 实战:用 CLI Skill 一键出

    本文是「腾讯云CLI实践」系列第 2 篇(共 2 篇): 第 1 篇:《腾讯云 CLI × 实战:用一行命令生成图片》 从零开始,在终端用腾讯云 CLI 调用接口——适合想理解底层原理 其他 AI IDE 或 Agent 平台,均可参考本文思路接入腾讯云能力。 详细环境配置步骤可以参考系列第 1 篇:《腾讯云CLI × 实战:用一行命令生成图片》 Step 1:安装 Skill 到项目 将 TextToImage-CLI Skill 放到项目的 .codebuddy 小结 TextToImage-CLI Skill 将腾讯云的完整调用链封装成了一个开箱即用的斜杠命令。对于需要在开发过程中快速生成素材、原型或灵感参考的场景,它是一个非常实用的效率工具。 当变成开发流程中随手可用的"小工具"时,AI 才真正融入了日常生产力。

    18811编辑于 2026-06-10
  • 腾讯发布开源加速库,时间缩短75%

    6月6日,腾讯发布针对腾讯文生开源大模型(以下简称为DiT模型)的加速库,让推理效率大幅提升,时间缩短75%。DiT模型的使用门槛也大幅降低。 用户可以基于ComfyUI的图形化界面,使用腾讯文生模型能力。 此前,腾讯宣布旗下的文生大模型全面升级并对外开源,可供企业与个人开发者免费商用。 用户可以通过图像化工作流使用DiT文生模型,实现与官方模型一样的效果。DiT文生模型的ComfyUI使用界面此外,围绕ComfyUI的使用生态,还衍生出强大的开源社区。 腾讯文生负责人芦清林表示:“腾讯文生模型开源之后得到了众多开发者的支持和反馈,我们十分高兴,也同时在针对开发者的反馈与社区一起完善和优化基于DiT的开源生态,让更多开发者能更便利地享受到最新的研究成果

    52200编辑于 2024-06-26
  • 来自专栏腾讯开源的专栏

    腾讯发布开源加速库,时间缩短75%

    6月6日,腾讯发布针对腾讯文生开源大模型(以下简称为腾讯DiT模型)的加速库,让推理效率大幅提升,时间缩短75%。 //使用门槛,降低了 腾讯DiT模型的使用门槛也大幅降低。 用户可以基于ComfyUI的图形化界面,使用腾讯文生模型能力。 此前,腾讯宣布旗下的腾讯文生大模型全面升级并对外开源,可供企业与个人开发者免费商用。 //速度,更快了 项目组通过知识蒸馏和TensorRT高性能推理框架,实现了DiT模型的采样步数压缩与高效推理部署。蒸馏主要指降低扩散模型迭代的步数实现加速。 用户可以通过图像化工作流使用腾讯DiT文生模型,实现与官方模型一样的效果。 腾讯DiT文生模型的ComfyUI使用界面 此外,围绕ComfyUI的使用生态,还衍生出强大的开源社区。

    65810编辑于 2024-06-13
  • 评测腾讯大模型,python调用文接口

    想丰富腾讯python sdk 调用大模型的实例。下面介绍python实现文接口ChatCompletions实例。 示例三多轮问答中调用查询天气工具时,大模型回答的有问题。

    1.8K20编辑于 2024-09-13
  • 来自专栏Arya好奇猫

    玩转腾讯 | 腾讯大模型AIGC使用指南 以及 文体验

    使用指南进入活动页面,然后选择专属优惠套餐服务选择文使用体验基础模型体验写一篇日记根据下面的故事情节让大模型写日记:猫妈妈生了3只小猫,有个男孩欺负小猫,当时猫妈妈不在,应该是叼这另一只小猫去安全的地方了

    66230编辑于 2024-10-18
  • 腾讯图像3.0驱动:ima文生能力及创作场景

    摘要: 腾讯图像3.0赋能ima,文生图强文字渲染,图上传照片即可生成写真、打卡、宣传海报,创作场景一站覆盖 一、文生进入"文字不崩"时代 做过设计的人都知道,AI文生最让人崩溃的不是画面不够精致 这个问题在腾讯图像3.0发布后,终于有了质的突破。 ima的文生能力正是由图像3.0驱动,其核心优势之一就是强文字渲染。 三、为什么是图像3.0? 图像3.0之所以能实现强文字渲染,背后是模型架构的深度优化。 五、:上传照片即可生成写真、打卡、宣传海报 2026年2月3日,ima正式接入图像3.0模型。 从促销海报到社交表情包,从家庭写真到房间布置预览,腾讯图像3.0驱动的ima文生能力,正在让每一个不会设计的人也能快速产出专业级视觉内容。

    16610编辑于 2026-06-11
  • 来自专栏腾讯开源的专栏

    给大模型“去油”,这个新研究火了

    感谢大家的喜欢 ♥️ 腾讯团队最近发布的工作SRPO受到了社区的热烈欢迎,项目在9月10日发布之后登上了HuggingFace热度榜榜首,同时社区量化版本下载量达25K,Github Star 该工作主要提供了文生模型的强化算法,解决了开源文生模型Flux的皮肤质感“过油”的问题,能让人像真实感提升3倍,Flux是目前开源文生社区中最广泛使用的基础模型。 为了解决这个问题,腾讯团队联合香港中文大学(深圳)和清华大学近日提出创新性解决方案:语义相对偏好优化(Semantic Relative Preference Optimization)。 tencent.github.io/srpo-project-page/ GitHub:https://github.com/Tencent-Hunyuan/SRPO 加入微信群即可了解更多“腾讯开源新动态” # 、#大模型、#文生、#开源、#腾讯、

    51310编辑于 2025-09-29
  • 打字即出图像2.0让AI进入“零延迟”时

    5月16日,腾讯推出Hunyuan Image2.0(图像2.0模型),基于超高压缩倍率的图像编解码器,全新扩散架构,实现超快的推理速度和超高质量图像生成,极大降低“AI味”。 :Hunyuan Image2.0在客观评测中超越同类图像生成竞品腾讯科技在第一时间进行了实测:1、 文生指令遵循的能力很强,能按照文字的改变,实时修改图片中的内容;2、 有“参考主体”、“参考轮廓 2、 图像生成图像:可调节遵循强度除了文字直接生成图片,图像2.0也支持上传参考,通过。但是,和传统模型不同的是,图像2.0可以提取主体或轮廓特征,融合文本指令生成新图像。 :主体一致输出,从左第一张图表示主体,后面依次是主体权重从低到高对应的效果通过-参考主体这个功能,可以轻松给自己家宠物生成各种“整活儿”图片,比如上传一张猫咪照片,图像参考强度设定为92, 同样,参考轮廓也可以设定参考的强度,比如下面的例子,左边第一张图表示边缘,后面依次是轮廓权重从低到高对应的效果。专业画师的生产力工具实时文生的功能,普通用户可以0门槛上手。

    1.5K10编辑于 2025-05-21
  • 「灵感瞬间」CodeBuddy++lighthouse助我实现漫画插图在线生成

    OK,轻量应用服务我们零购了!会收到成功的通知。 然后我们需要买一点的资源套餐。 上述完成后,基本配置就完成了,下面我们进入开发对话! : 基础参数:分辨率、风格等核心设置 高级参数:种子值、Logo添加等专业选项 扩展参数:负向提示词等实验性功能 技术挑战与突破 初始困境:API集成的复杂性 项目开始时,我面临的最大技术瓶颈是腾讯云 的突破性帮助: 自动生成了完整的API签名算法实现 提供了详细的参数映射和错误处理机制 指导我从手动实现转向官方SDK集成 根据官方提供的说明文档,我先借助CodeBuddy搭建了一套简易的框架,测试了一版

    87821编辑于 2025-11-03
  • 腾讯3D产品概要

    一、 产品定位与核心亮点 腾讯3D 是基于腾讯自研大模型的AI 3D内容生成平台。 其核心技术属性在于将传统的专业3D建模流程进行AI化重构,核心商业差异化卖点在于将传统需数天、成本数千的建模工作压缩至“分钟级完成、成本仅数”,旨在帮助企业实现极致的降本增效与业务创新。 功能框架 产品提供多元化的生成与处理能力,涵盖以下模块: 生成类:文生3D、3D人物生成、草图3D、组件生成、纹理生成。 处理类:白模生成、智能拓扑、UV展开。 2. 解决方案:应用腾讯3D技术。 成效:原文未提供具体量化指标。 2. Lovart 背景:Lovart 属于泛互行业,定位为平台工具厂商。 解决方案:应用AI技术能力。 数据来源:<腾讯3D产品手册>

    15710编辑于 2026-06-01
  • 来自专栏腾讯云智能·AI公有云

    腾讯云CLI × 实战:用一行命令生成图片

    本文是「腾讯云CLI实践」系列第 1 篇(共 2 篇): 第 1 篇(本文):从零开始,在终端用腾讯云 CLI 调用接口——适合想理解底层原理、有脚本化/批量需求的开发者。 第 2 篇:《CodeBuddy × 实战:用 CLI Skill 一键出》结合CodeBuddy等平台,用 CLI Skill 一键,开箱即用——适合日常开发中快速出。 大多数人使用 AI 时,习惯打开 Web 控制台或第三方应用。 result_image.png','wb').write(base64.b64decode(data['ResultImage'])) " 解码完成后,打开 result_image.png,就能看到模型为你生成的画作了 适用场景 除了本文演示的单次生,腾讯云CLI+的方式在以下场景同样适用: 批量运营素材:电商大促需要 100+ 张商品主/场景,Shell 循环 + Prompt 文件批量出; CI/CD

    13610编辑于 2026-06-10
  • 腾讯3D产品概要

    一、 产品定位与核心亮点 腾讯3D是一款基于腾讯自研大模型的AI 3D内容生成平台。 其核心商业差异化在于,能将传统需数天完成、成本数千的专业3D建模工作,压缩至 “分钟级完成、成本仅数”,旨在帮助企业实现极致降本增效与业务创新。 三、 应用框架和功能介绍 功能框架 产品提供多元化的生成模块,包括: 文生3D 3D人物生成 白模生成 草图3D 智能拓扑 纹理生成 组件生成 UV展开 硬核指标 建模精度:支持1536³分辨率、36

    12510编辑于 2026-06-01
  • 来自专栏Java项目实战

    可灵平替 SkyReels: 升级版 视频

    SkyReels加上Video则可以实现视频的高精度视频和加速模型,并且实际测试的话,很低的分辨率就可以实现视频加上目前本地测试的时长也是完全可以接受的,而且测试的视频超级的清晰,不会出现扭曲 1.首先拖入工作流 2.下载对应的模型 a.官方的视频模型,相当于大模型,需要放在大模型unet的文件夹 b.对应的VAE,这里搭配的也是跟官方精度一致的F16 Vae,放在vae 长度需要看本地的显卡显存大小,虽然说是97帧,但是为了速度,我们缩小到50帧左右就可以,所以我给到了57帧,但是视频的帧率我给到了30帧,希望更清晰一点 实际测试开了多个AI应用的前提下,846S完事,目前测试多多次测试

    1.4K10编辑于 2025-02-25
  • 来自专栏腾讯开源的专栏

    腾讯2.1开源!可写字、更高清、更一致、更可玩!

    经过一段时间的打磨,昨天,我们带来了腾讯最新的模型“图像2.1(HunyuanImage 2.1)”。 这是一个开源的文生模型,支持原生2K,在多个方面达到业界领先水平: 01、在2.0架构的基础上全面升级,更加注重生成效果与性能之间的平衡,性能更强 02、不仅支持中英文的原生输入,还能够实现中英文文本与复杂语义的高质量生成 另外,一个提前打听到的消息:原生多模态图像生成模型,也在路上了。 先看看图像2.1都有什么东西。 因此,模型能高效原生生成2K。 在文本编码方面,图像2.1配备了双文本编码器:一个MLLM模块用于进一步提升图文对齐能力,另一个ByT5模型则增强了文字生成表现力。 腾讯在图像生成领域持续深耕,曾发布首个开源的中文原生DiT架构图像大模型——DiT,以及业界首个商用级实时模型——图像2.0。

    1.3K10编辑于 2025-09-11
  • 来自专栏腾讯云智能·AI公有云

    腾讯视频模型已上线,企业用户可申请腾讯云API接入

    腾讯视频模型目前已经上线,企业和开发者可在腾讯云申请使用API接口;用户通过AI视频官网即可体验。 视频生成开源模型目前在Github、HuggingFace等主流开发者社区均可下载体验。 腾讯发布视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。 基于视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。 捏扁特效LoRA模型 开源技术报告披露,视频生成模型具备灵活的扩展性,视频和文生视频在相同的数据集上开展预训练工作。 视频模型目前已经在腾讯云上线,企业和开发者可扫描下方二维码或点击【阅读原文】申请使用API接口。

    2K10编辑于 2025-03-17
  • 腾讯文生大模型全面开源!

    和大家汇报:刚刚,腾讯文生大模型,全面升级并对外开源!作为业内首个中文原生的DiT架构开源模型,腾讯文生支持中英文双语输入及理解。除直接用于文生,也可作为视频等多模态视觉生成的基础。 去年7月,腾讯文生团队就明确了基于DiT架构的模型方向。(DiT是基于Transformer的扩散模型架构,是Sora、Stable Diffusion 3 也选用的关键技术。) 今年初,腾讯文生完成了模型架构的全面升级,相比上一代整体效果提升超过20%。 中文原生的腾讯文生,母语就是中文:通过对汉语字符系统、文化内涵的深度学习,对国风元素和中文复杂性有更深刻的理解。 //全面开源目前,腾讯文生大模型已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型。不管是企业还是个人开发者,全部免费可用。

    1.1K10编辑于 2024-05-14
  • 来自专栏腾讯开源的专栏

    腾讯视频生成再升级,发布视频、音频与动作驱动等能力

    腾讯视频模型目前已经上线,企业和开发者可在腾讯云申请使用API接口;用户通过AI视频官网即可体验。 视频生成开源模型目前在Github、HuggingFace等主流开发者社区均可下载体验。 腾讯发布视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。 基于视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。 开源技术报告披露,视频生成模型具备灵活的扩展性,视频和文生视频在相同的数据集上开展预训练工作。 视频模型目前已经在腾讯云上线,企业和开发者可扫描下方二维码或点击【阅读原文】申请使用API接口。

    1.9K10编辑于 2025-03-07
领券