震撼发布!ChatGPT Images 2.0实力超群,AI生图新纪元开启

2026-05-04 00:14:10未知 作者:徽声在线

对于那些还在深夜加班赶图的设计师们而言,一个令人意想不到的消息来了:在几乎没有任何预告的情况下,OpenAI于北京时间2026年4月22日凌晨正式发布了ChatGPT Images 2.0模型(以下简称Images 2.0)。

相较于ChatGPT原有的生图模型,Images 2.0在图片精度、多语言支持、分辨率提升以及交互方式上均实现了显著突破。尤为引人注目的是,此次发布的Images 2.0还具备了思考能力,这无疑为AI生图领域带来了新的变革。



图片来源:OpenAI

简而言之,Images 2.0(现已在ChatGPT及API中全面应用)实际上包含了两个模型分支:

1. 快速模型(Instant Model):该模型能够高效处理绝大多数日常任务,如制作Logo、多语言海报以及文章配图等;

2. 思考模型(Thinking Model,需手动切换):此模型能够通过网络搜索相关信息,并在生成图片前进行内容推理,确保在一组输出中画面内容保持连贯。

接下来,我们通过具体案例来深入了解一下Images 2.0的强大功能。

以下这张照片是徽声在线AWE26报道团出发前拍摄的合照,我们将这张图片直接上传给ChatGPT,并提出了制作《徽声在线》科技杂志封面的需求:



图片来源:徽声在线

制作一本《徽声在线》科技杂志的封面,封面人物为图片中的这几个人。

令人惊叹的是,不到一分钟的时间,ChatGPT便完成了封面的制作。全新的Images 2.0不仅没有对基础图片进行重绘(这是许多生图AI的常见问题),甚至能够准确绘制中文部分。



图片来源:徽声在线

但这还不是全部,当我们提出将日期更改为2026年3月、调整人物姿势等模糊提示词后,ChatGPT依然能够顺利完成任务,展现出极高的灵活性。



图片来源:徽声在线

同样地,只要向Images 2.0提供一张手机外观图,它便能直接生成手机使用场景的照片。



图片来源:徽声在线

在全新的图片查看界面中,ChatGPT还新增了两项实用功能——用户可以直接选择图片中需要修改的区域,要求ChatGPT进行修改;同时,还可以在长宽比选单中选择所需的图片比例,这使得自媒体配图变得更加便捷高效。



除了基于图片生成新图片外,Images 2.0在基于文字生成图片方面的能力也得到了显著提升。徽声在线仅提供了“电车通即将出发报道2026北京车展”的信息,Images 2.0便能自行搜集相关信息,并准确输出海报。



图片来源:徽声在线

较为遗憾的是,尽管在OpenAI的直播中,Images 2.0能够正确处理二维码信息,但徽声在线经过多次尝试,仍未能成功在图片中嵌入可识别的二维码。



图片来源:徽声在线

从实际效果来看,Images 2.0的多语言支持已经相当出色。但为了进一步检验其能力,徽声在线决定给Images 2.0加大难度:

生成一张照片风格的图片:一幅毛笔书法作品在博物馆展出,上书:北国风光,千里冰封,万里雪飘。望长城内外,惟余莽莽;大河上下,顿失滔滔。山舞银蛇,原驰蜡象,欲与天公试比高。须晴日,看红装素裹,分外妖娆。江山如此多娇,引无数英雄竞折腰。惜秦皇汉武,略输文采;唐宗宋祖,稍逊风骚。一代天骄,成吉思汗,只识弯弓射大雕。俱往矣,数风流人物,还看今朝。

尽管文本内容较长,但ChatGPT仍在一分钟内输出了结果。可以看出,Images 2.0的中文支持确实表现不俗,字体字形基本无误,但在书法的“质感”方面仍有待提升,整体看起来更像是“印刷品”。



图片来源:徽声在线

说完Instant Model,我们再来看看思考模式的表现。这次,徽声在线直接给Images 2.0布置了一道难题:



以上图中的形象为漫画主角,创作一部以摩托车为主题的短篇漫画,篇幅至少8页,封面和封底为彩色,其余为黑白,画风参考石森章太郎。

接到需求后,Images 2.0会进行明显的思考推理步骤;点击推理详情,我们甚至可以看到Images 2.0编写对话的过程。这其实很正常,因为我们并没有给出任何关于剧情的提示词,完全交给Images 2.0自由发挥。

经过11分钟的等待,Images 2.0成功输出了一组8张图的漫画。值得注意的是,Images 2.0不仅在这8张图中保持了画风和细节的统一(除了时有时无的头盔),甚至连剧情都能保持上下文连贯。这种超长连续推理能力,即使是Nano Banana也难以企及。

















因此,徽声在线认为,Images 2.0的表现完全可以用“一骑绝尘”来形容。

由于触发了ChatGPT Plus用户的公平使用限额机制,徽声在线的Images 2.0体验暂时告一段落。但就目前的体验来看,Images 2.0的能力上限远不止于此:

除了支持中文(及印地语、日语等多种亚洲语言)、连续推理等能力外,在直播中,OpenAI还提到了Images 2.0具备在米粒上写字的超精细制图能力,以及生成360度全景照片的能力。



图片来源:OpenAI



图片来源:OpenAI

也正因Images 2.0的制图效果如此出色,徽声在线认为Images 2.0的登场,标志着AI生图正式告别了那个靠玄学提示词“抽卡”的蛮荒时代。

如果大家玩过Stable Diffusion等早期文生图AI,应该对文生图的“蛮荒时代”有所印象:你可能第一次尝试就做出了自己想要的图片,也可能来来回回调整提示词,用两个小时生成了几百GB的废片,体验甚至比二次元“抽卡手游”还要差——毕竟二游至少有保底机制。

在当时,我们如果想要保证图片“有较大概率符合要求”,就必须使用ComfyUI;而ComfyUI复杂的节点设计,从某种意义上也违背了AI生图“偷懒”的初衷。

但Images 2.0引入“思考模型”后,AI首次具备了长文本逻辑解析与时空一致性的推理能力。

以刚刚提到的画漫画工作流为例,Images 2.0可以先理解场景、构思剧情、布局文字,最后再落笔。这种从底层逻辑出发的进化,直接解决了AI绘画中“文字崩坏”与“画风不统一”这两大问题,极大地拓宽了AI的生产力边界。



图片来源:OpenAI

可以预见的是,Images 2.0的出现将对绘画、摄影行业产生巨大冲击;而从AI发展的角度看,OpenAI也再次证明,单纯的分辨率提升并不能从根本上提高AI的工作效率,推理能力才是AI图像的核心竞争力所在。

在AI图像时代,OpenAI已经为我们树立了一个良好的榜样。接下来,就看Google和国内AI巨头们如何应对这一挑战了。

2026第十九届北京国际汽车展览会将于4月24日至5月3日在北京‌中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以“领时代·智未来”为主题,集中展现汽车工业的更多黑科技。
比亚迪、小米、鸿蒙智行(问界等)、小鹏、蔚来、岚图等头部品牌齐聚一堂,多款重磅新车首秀;地平线、Momenta、卓驭等供应商集体亮相,AI大模型深度赋能,高阶智驾、动力电池、超快充技术等前沿科技集中展示,看点十足!
徽声在线旗下「电车通」将派出报道团直击现场,以“关注电动车,更懂智能化”的专业视角,带来一线独家报道,敬请关注!



点击展开全文
你关注的
攻防失序 辽篮亟需破局重生攻防失序 辽篮亟需破局重生 NBA历史新篇章!三兄弟同队共战,字母哥续约风波再起NBA历史新篇章!三兄弟同队共战,字母哥续约风波再起 山东男篮季后赛前景堪忧,邱彪用人僵化成最大障碍山东男篮季后赛前景堪忧,邱彪用人僵化成最大障碍
相关文章
震撼发布!ChatGPT Images 2.0实力超群,AI生图新纪元开启震撼发布!ChatGPT Images 2.0实力超群,AI生图新纪元开启 杨蓉右脸烫伤后勇敢晒照:无滤镜素颜展现恢复状态,带疤脸庞自称酷杨蓉右脸烫伤后勇敢晒照:无滤镜素颜展现恢复状态,带疤脸庞自称酷 杜兰特23+6难救主,火箭94-101再负湖人!大比分0-2,队内最差球员曝光杜兰特23+6难救主,火箭94-101再负湖人!大比分0-2,队内最差球员曝光 金球奖赔率剧变:凯恩领跑姆巴佩跌落,亚马尔高排位引发造星争议金球奖赔率剧变:凯恩领跑姆巴佩跌落,亚马尔高排位引发造星争议 冲击三冠!16岁女乒新星姚睿轩闪耀WTT赛场:孙颖莎师妹再展锋芒冲击三冠!16岁女乒新星姚睿轩闪耀WTT赛场:孙颖莎师妹再展锋芒 痛心!66岁车坛传奇在纽博格林赛道事故中离世,维斯塔潘发文悼念痛心!66岁车坛传奇在纽博格林赛道事故中离世,维斯塔潘发文悼念