首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • ChatGPT全面精通-自动化办公/GPTs商店/AI绘画/提示词|果fx

    DallE3作为OpenAI的最新文生图工具,已经升级到版本3,相比之前的版本,其画图能力有了显著增强。DallE3能够理解更多的细微差别和细节,使得用户可以将自己的想法转化为非常准确的图像。 此外,DallE3与ChatGPT的结合,使得AI绘画的门槛大大降低,基本上会用ChatGPT的人都会很快掌握DallE3。 通过GPT 4.0和DallE3的结合,用户可以实现从文本到图像的无缝创作体验。 DallE3在图像生成方面的技术进步和新特性有哪些? GPT 4.0、代码解释器扩展和DallE3结合对广告、教育和游戏领域的具体影响是什么?

    31210编辑于 2024-11-08
  • AI能直接生成海报了,我愿称Ideogram为新晋之王。

    而以语义理解闻名天下的Dalle3,美感极度拉跨,字也写错了,但是大的东西没丢。 我们再来看看Ideogram。 这次的2.0更新,重点更新了模型的质量,还有继续究极进化的语义理解能力,我觉得已经是吊打Dalle3的级别了。。。 Ideogram整体的模型质量,如果让我评价的话,综合质量在Flux pro之上,Midjourney之下,但同时有两块超长的长板,就是超过Dalle3的语义理解能力,以及领先一个世代的文字生成能力。

    37200编辑于 2025-04-14
  • AI领域的赛博佛祖,他的名字,叫张吕敏。

    有一个东西跟Omost用的是同样的技术路线,它叫Dalle3。 但是,Dalle3毕竟是OpenAI的玩意,你只能付费氪金用,没有开源。 但是Omost,开源。 当把所有的代码输出完后,我们直接点渲染就行,一幅飞船图就出来了~ 也可以跟Dalle3一样,再进行对话式的区域修改,比如把背景从太空换成海洋等等。

    51400编辑于 2025-04-14
  • 来自专栏DotNet NB && CloudNative

    AIBotPro,基于.NET 6 的 AI 聚合客户端,支持知识库、插件开发、AI流程引擎

    功能特性 功能齐全,灵活应用,文件上传、图像识别、AI绘画(Midjourney、DALLE3、Flux),多样化功能满足各类需求。

    40000编辑于 2025-06-11
  • 来自专栏机器之心

    刷爆多模态任务榜单!贾佳亚团队Mini-Gemini登热榜,代码、模型、数据全部开源

    通过一些抽象的多模态指令来让模型给出推理,并生成合适的图片,这个操作就很像是 ChatGPT 和 DALLE3 的联动了! 对于图像的生成部分,Mini-Gemini 借助了 SDXL,使用 LLM 推理后所生成的文本链接两个模型,类似于 DALLE3 的流程。

    31610编辑于 2024-04-19
  • 来自专栏我爱计算机视觉

    生图超级外挂!贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT4+DALLE3王炸组合

    通过一些抽象的多模态指令来让模型给出推理,并生成合适的图片,这个操作就很像是ChatGPT和DALLE3的联动了! 对于图像的生成部分,Mini-Gemini借助了SDXL,使用LLM推理后所生成的文本链接两个模型,类似于DALLE3的流程。

    34610编辑于 2024-04-18
  • 来自专栏AgenticAI

    年末巨献!DeepSeek推出多模态模型Janus-Pro,统一理解与生成

    它仅用7B参数就超越了Stable Diffusion和Dalle3。 一、为什么Janus-Pro是革命性突破?

    61600编辑于 2025-03-18
  • 来自专栏不二小段

    OpenAI 悄悄推出全能版 GPT-4,网友:宣告 ChatPDF 类产品的死亡

    再比如在体验 DALL·E 3 绘图的时候:OpenAI 虽然分别推出了能识图的 GPT-4v 和 DALLE 3,但二者现在并不能整合,也没办法实现图生图效果,所以今天来测试一下 GPT-4v 反推 DALLE3

    54100编辑于 2023-10-29
  • 来自专栏AI算法能力提高班

    DALL-E3 | (1)简介

    Experiments Conclusions 现在不需要提示词工程了,直接和chatGPT对话迭代修改到您满意(你的想法和生成的图像高度匹配) 图像生成质量堪比Midjourney,由于加持了ChatGPT,DALLE3

    80630编辑于 2023-10-16
  • 来自专栏小义思

    字节跳动版GPT商店,免费白嫖GPT4.0!

    插件选择添加dalle3,这样既能对话又能生图,方便快捷。 配置好之后,调试看看效果,可以看出图片生成的质量还是不错的。 移动端使用 如果只是想白嫖GPT4.0,那么到这里其实就已经可以结束了。

    82310编辑于 2024-04-10
  • 来自专栏【腾讯云开发者】

    “破解”GPT-4o生图技术:万物皆可吉卜力的技术路线推测

    更加值得关注的其实是这次GPT-4o出了超多特别惊人的技术,基本上可以说是GPT本T长了手能画画了,不再存在GPT生成prompt命令呼叫DALLE3导致的信息损耗了。 (最开始GPT还不会自己画图的时候,是通过调用文生图大模型DALLE3来画图的,而不是它本身能产生图片) 例如它可以写非常非常长的文字: 例如给定风格参考图让它画一个类似的海报: 例如直接通过对话修改图片 比如说制造抹茶那个四格,如果是之前的流程,可能需要先让GPT生成抹茶做法的四个步骤,然后再让它把步骤转换成文生图模型的prompt,再调用DALLE3把图片画出来。 每一个步骤都可能有损耗,尤其是最后一步,DALLE3可能没办法有这么好的文本对应性能精准画出这样的内容。但是GPT如果本来就会画画,事情就会变得很自然了。

    73010编辑于 2025-04-11
  • 来自专栏全网漫游指南

    GPT和它的AI朋友们 | 漫游日报 1109

    现在你可以在Edge浏览器或者Bing的手机端直接免费使用AI功能(GPT4 + Dalle3)。

    45630编辑于 2023-11-10
  • 来自专栏AI技术探索和应用

    浅析SORA视频生成原理

    Sora团队的Leader是Aditya Ramesh(http://adityaramesh.com/), 他是DALLE、DALLE2、DALLE3的主要作者。 (3)如何保证长视频的质量 首先训练数据一定是下了很多功夫,从report中我们也看到openai使用了类似DALLE3的cationining技术,训练了自己的video captioner,用以给视频生成详尽的文本描述

    1.7K20编辑于 2024-03-14
  • 来自专栏AI uTools

    字节跳动发布AI图像编辑工具:SeedEdit 无需专业图片处理技能,一句话即可实现P图

    与商业编辑工具对比 DALLE3:更符合文字提示,但可能引入意外的内容修改。 Midjourney:在美学上表现优异,但对指令的准确性稍差。

    3.9K10编辑于 2024-11-14
  • 来自专栏AI及人工智能

    AI技术学习分享:从"啊哈时刻"到创造力的觉醒

    指令执行者"进化为"创意架构师",掌握三大核心技法:​1.多模态思维融合将文本描述转化为视觉草图:# 使用DALL·E 3生成概念图from dall_e import Dalle3generator = Dalle3

    35510编辑于 2025-03-20
  • 来自专栏Spring Boot学习之路

    人工智能文生视频大模型Sora,颠覆性的革命?

    Sora的技术原理:它是扩散模型,生成一个视频通过一个静止的噪声开始,然后逐步移除噪声,同时核心架构还是用的Transformer,建立在DALLE3和GPT上通过让模型一次看到许多帧,他们解决了一个具有挑战性的问题

    57200编辑于 2025-01-13
  • 来自专栏开源心路

    GLM-4 能力接近ChatGPT4和Claude 2.1

    多模态-文生图:CogView3在文生图多个评测指标上,相比DALLE3 约在 91.4% ~99.3%的水平之间。

    1K10编辑于 2024-01-19
  • 来自专栏腾讯云智能·AI公有云

    紧跟“AI生成内容”新规,内容平台如何高效应对?

    我们依托腾讯优图实验室的顶尖科研能力,覆盖Stable Diffusion 、Midjourney、Dalle3、GPT-4o等主流大模型,确保对新型伪造手段的快速感知。同时,我们拒绝“一刀切”识别。

    51210编辑于 2026-03-30
  • 来自专栏XINDOO的专栏

    OpenAI Assistants-API简明教程

    assistants-api目前还处于beta版本,但从OpenAI的规划来看,后续应该是会支持DALLE3、gpt4-v甚至是plugin的,我们可以期待下。   如果后续assistants-api支持了plugin、DALLE3和gpt4-v之后,你完全可以认为它就是一个api版本的chatGPT-Plus,当然功能可以可以完全定制,相信看到这里你肯定也蠢蠢欲动

    2.3K01编辑于 2023-11-19
  • 来自专栏得物技术

    深入理解Sora技术原理

    使用 DALLE3 的重标注技术,对人工标注的文本进行训练,生成能更加详细描述视频的标注信息。 生成高度描述性的文本标注​使用 DALLE3 的技术,首先训练一个模型,这个模型专门用于为视频内容生成高度描述性的文本标注。这一步是为了提升文本标注的质量,让其更加详细和具体。 通过 GPT 模型理解并优化提示词​类似于 DALLE3,Sora 在处理用户提供的文本提示时,也可以利用 GPT 模型来扩展或优化这些提示。

    1.1K10编辑于 2024-03-20
领券