近期在刷推的过程中,使用 GPT-4o 生成图像的推文越来越多,我还寻思这功能不是很早就发布了吗,为什么这两天满屏幕使用 GPT-4o 生成的图像?深入摸索了一番,才知道是 GPT-4o 最近更新增加了原生图像生成功能,允许直接创建和修改图像。
OpenAI 的 gpt-4o 最近迎来了一次重大更新,特别是在图像生成方面的能力显著增强。这一更新于 2025 年 3 月 25 日通过直播宣布,标志着 gpt-4o 从多模态处理扩展到原生图像生成功能。以下是详细分析,包括背景、更新内容、用户反馈和潜在影响。
不过不得不说,生成的图像真挺不错,有些甚至需要专业射鸡师生成的图像/图标,GPT 轻而易举就可以生成。下面是来自推上一些大V们使用 GPT-4o 生成的图像/图标。




文章目录
Gpt-4o 的背景与之前能力
GPT-4o 是 OpenAI 在 2024 年 5 月发布的旗舰多模态模型,支持文本、音频和图像输入输出。之前,它能解读图像,例如从视觉输入中提取信息,但 图像生成 则依赖另一个模型 DALL-E 3。DALL-E 3 虽然集成在 ChatGPT 中,但与 gpt-4o 的文本处理分离,导致用户体验不够流畅,上下文难以完全同步。
最近更新的核心:原生图像生成
2025 年 3 月 25 日,OpenAI 宣布 gpt-4o 现在能原生生成和修改图像。这一功能直接内置于模型中,意味着用户可以在同一个聊天界面中生成图像,而无需切换到其他工具。OpenAI 表示,这一功能现已对 ChatGPT 的 $200/月 Pro 计划用户开放(目前 Plus 也已可用),并计划逐步扩展到 Plus 和免费用户,以及 API 开发者。
根据 TechCrunch 报道,新功能比 DALL-E 3 更准确,生成图像时“思考”时间更长,以确保细节和准确性。例如,它能更好地渲染文本,处理复杂场景,并保持多步指令的一致性。
用户反馈与示例
更新发布后,全球用户,尤其是中文用户,在 X 上积极分享体验。例如,X 用户@_cyberkittyy 分享了用 gpt-4o 生成的“动漫 x Nike 概念”图像,称其“绝对惊人”。

图像生成提示词
以下提示词是来自推大佬 @hylarucoder 发布的提示词以及示例图像,如果觉得有用,还请多多支持关注一波大佬,这里仅用作展示(侵删)。
1「帮我生成一张庆祝推特 10000 粉丝的设计图」

2「幽默搞笑风, 最好有个紫色头发日漫妹子说「我还有523个粉丝才毕业,请求订阅」

3「我想要这张图片的风格, 但是内容变更为「三个紫毛妹妹」第一个举牌子「点赞」第二个举牌子「关注」第三个举牌子「收藏」, 动作各异. 照片要宽一些, 能容下三个人」

4「Q 一点的版本」

5「设计一些排版干净简单的封面你可以直接上传参考图」

原贴中提供的提示词众多,大家可以参考大佬的原贴进行查看。
技术细节与比较
与 DALL-E 3 不同,gpt-4o 的图像生成是其多模态训练的一部分,意味着它能利用对话上下文生成更相关的图像。VentureBeat 报道 指出,新功能生成更逼真的图像,文本渲染更准确,适合处理 15-20 个对象的复杂提示,而 DALL-E 3 在多对象场景中容易混淆。
生成时间可能较长,某些复杂图像可能需要一分钟,这可能是资源分配和需求高峰期的权衡。TechRadar 文章 提到,免费用户每天生成图像的数量与 DALL-E 3 相同,但具体限额可能随需求调整。
潜在应用与影响
这一更新扩展了 gpt-4o 的应用场景:
领域 | 应用示例 |
---|---|
艺术与设计 | 生成草图、最终艺术品或设计资产 |
教育 | 创建教学图表、视觉辅助工具 |
商业 | 快速生成产品图像或营销材料 |
个人使用 | 制作社交媒体图片、邀请函等 |
研究表明,这一功能可能改变 AI 在内容创作中的角色,尤其是在教育和商业领域。然而,伦理问题不容忽视,包括生成不当内容的风险和版权争议。Maginative 文章 提到,OpenAI 使用内部工具限制有害内容,但仍需关注多语言文本渲染(如非拉丁字符)的问题。
局限性与挑战
尽管进步显著,gpt-4o 的图像生成仍面临挑战:
问题 | 描述 |
---|---|
生成时间 | 比文本生成更慢,可能影响实时体验 |
准确性 | 复杂或模糊提示可能导致错误 |
伦理风险 | 可能生成有害内容,涉及版权争议 |
多语言支持 | 非拉丁字符渲染可能出现问题 |
结论
gpt-4o 原生图像生成功能的引入是 AI 技术的重要进步,增强了其多模态能力,特别是在图像生成与文本处理的整合上。这一更新不仅提升了用户体验,也为艺术、教育和商业等领域提供了新工具。尽管存在生成时间和伦理挑战,未来改进有望进一步优化其性能。全球范围内的积极反馈,特别是中文用户的参与,显示了其潜在的广泛影响。
本文标题:GPT-4o 原生图像生成功能发布,射鸡师怕是要下岗了
本文链接:https://uuzi.net/gpt-4-native-image-generation-launch/
本文标签:GPT-4o,图像生成,设计师,人工智能
发布日期:2025年3月27日
更新日期:2025年3月27日
版权声明:兔哥原创内容,版权所有人为本网站作者,请勿转载,违者必究!
免责声明:文中如涉及第三方资源,均来自互联网,仅供学习研究,禁止商业使用,如有侵权,联系24小时内删除!