这一次，OpenAI干掉了90%人类设计师

资讯组小编 • 文章来源: 硅基星芒 • 2026年4月23日下午2:24 • 新闻

Sam Altman那个著名的梗，这次应验在所有人身上了。

去年宣传GPT-5的时候，这位OpenAI的CEO说了一句后来被全网玩坏的话：“那种感觉，就像看到原子弹爆炸，整个人眩晕瘫坐。”此后每逢AI圈发布新品、配上夸张文案，这个梗就被拉出来反复鞭尸。

但前天深夜，眩晕瘫坐的可不是奥特曼。这回成了所有盯着屏幕等OpenAI出牌的用户。

奥特曼照例故作神秘，发了一条推文：“我们准备了一些有趣的东西。”

到了凌晨三点，GPT-Image 2落地。全球AI界直接炸场。

“Images are a language, not decoration.”

这是OpenAI写在发布页上的第一句话。翻译过来就一个意思：从今天起，图像不再是装饰品，它本身就是语言。这是对整个计算机视觉行业发出的代际跃迁宣言。

过去一整年，AI绘图还困在“画得像不像”的审美泥潭里。GPT-Image 2一出现，直接按下了切换键——AI生图正式进入“逻辑对不对”的智力考场。

这款模型的精度，用“恐怖”来形容不过分。

在Artificial Analysis的文生图和图像编辑排行榜上双双登顶，实战表现更是碾压级的。

那种感觉，就像视频生成领域Seedance 2.0降临时一样，它早就不当人类的辅助工具了，它在定义新的行业标准。

注：本文的图片全部由GPT-Image 2生成，图片内容纯属虚构。

思维引擎的觉醒

过去，人们评判一个图像模型好不好，第一标准是像不像真人、像不像参照物。

在GPT-Image 2这个怪物面前，这套标准过时了。彻底过时。

新模型最核心的突破点在这儿：它是一个支持思考模式的图像模型。

什么意思？用户输入提示词之后，模型不再简单去噪、拼接像素。它先在后台完成一次思维建模，再动笔。

Linux.do社区流出的一张实测图最能说明问题。模型模拟了雷军直播跑步的画面：

图源：https://cdn3.linux.do/original/4X/0/f/3/0f37c8bc968e3d563cc6100d8e7f80ee305661ff.jpeg

这张图让不少开发者倒吸一口凉气。雷总面部特征精准还原——简直像照片——图中还赫然显示着：直播目标1313km、已跑里程425.7km、剩余里程887.3km。更绝的是，当前海拔标着3658m。

3658m是什么概念？从北京到拉萨，进入藏区的典型海拔，恰好就是这个数。

在人类眼里，这不过是简单的数学加减法和地理常识。但请你想一想：对于一个图像模型来说，数学逻辑 + 地理常识 + UI规范的三重统一，意味着什么？

结论很直接：在生成第一个像素之前，GPT-Image 2已经完成了一轮推理。它理解了“里程”的含义，理解了加减法的逻辑关系，也理解了高海拔地区的视觉特征。

这哪里是画画。这是思考。

从玩具到生产力

在这种能力面前，所有人对图像模型的态度，该变一变了。

它早就不是你拿来画头像、做壁纸的玩具了。一脚迈过“可用”门槛，直接冲进“好用”区间——一个能扔进商业场景直接干活的工具。

拿海报设计来说。GPT-Image 2的构图审美、光影处理、对品牌调性的拿捏，毫无疑问达到了绝大多数普通人类设计师难以企及的高度。

图源：https://cdn3.linux.do/original/4X/7/a/1/7a12ccd6b745be5ad8828eb0ac225d218fb43cbc.jpeg

在人类社会中，聘请一位高级美工设计一张商业级海报，沟通成本、时间成本和上千元的设计报酬往往对中小企业来说是沉重的负担。

然而，有了GPT-Image 2，即使效果不满意调整几十次，成本也不过是几美元的级别。

在海报设计、营销素材、插画配图这些领域，用户在乎的根本不是“真不真”，在乎的是“好不好看、准不准”。正因如此，AI的替代效率是毁灭性的。

在同步更新的开发者文档中，还隐藏着一个令人兴奋的细节：示例代码中频繁出现了model: “gpt-5.4”。

思考模式加上旗舰模型，这个组合暗示了一件事：GPT-Image 2绝非孤立产品。它是为下一代大语言模型而生的视觉终端。

通过新的Responses API，生图过程会像和大语言模型聊天一般自然地交互。模型新增了允许多轮对话修改的功能，首次生图结束后，用户可以提出各种让乙方头疼的指令进行修改。

通过新的Responses API，生图过程会像和大语言模型聊天一样自然交互。模型新增了多轮对话修改功能，第一版生成后，用户可以提出各种让乙方设计师血压飙升的指令：“背景再暗一点。”“Logo往旁边挪几个像素。”

这些交互式实时修改需求，恰恰是设计师日常工作中最繁琐、最消耗耐心的部分。现在，迎刃而解。

中文渲染的巅峰

GPT-Image 2虽然是国外的模型，国内用户却一边倒地叫好。

原因只有一个：它对汉字的支持，堪称完美。

在社区的实测返图中，你能看到罗永浩和王自如的名场面辩论：

图源：https://cdn3.linux.do/original/4X/0/9/7/097ed46991d2464442aebc6b1076a292cc839fec.jpeg

能看到马斯克直播带货老干妈：

图源：https://cdn3.linux.do/original/4X/2/f/a/2fa77cf040e6337643829df4ec5ca6467d2866b2.jpeg

甚至能看到医生写的药方：

图源：https://cdn3.linux.do/original/4X/9/f/f/9ffeab83675648b43116cd0763f6c8b560611ae6.jpeg

这些图片中的文字，早已不再是歪七扭八、胡乱拼凑的“伪汉字”，而是具备书法韵味、字体层次感和排版艺术的成熟设计稿。

显然，OpenAI在训练集里灌入了海量中文语料图像，做了针对性强训。

和前代模型比起来，GPT-Image 2的强大得以更加淋漓尽致地体现。

在对比测试中，前代模型1.5版本虽然能画出像菜谱的东西，但仔细一看，文字几乎全是乱码。

图源：https://cdn3.linux.do/optimized/4X/2/b/3/2b38f3c1a134515d564f07f81661c0bd9578c6b9_2_750x750.jpeg

但GPT-Image 2生成的相同菜谱，却让人看到了文字清晰度和审美已经有了里程碑式的突破。

图源：https://cdn3.linux.do/original/4X/0/2/5/02513b10135d824ccb1c22bd0c7eb441f1e34455.jpeg

对于上百个中文字符的提示词，五个步骤仍然清晰可见，图文一致性令人满意。这不仅是一张图，还是一套可复现的实操方案。

不过，这里也带出一个有趣的技术问题：图像模型真的彻底解决了乱码问题吗？

我的判断是：恐怕没有。

大语言模型生成token，靠的是语义逻辑。强化学习阶段以概率为依据，高质量语料越多，逻辑越合理。但图像模型的本质，终究是像素生成。像素之间的逻辑关系，跟文字之间的逻辑关系，根本不是一回事。

换句话说，强大如GPT-Image 2，也并没有真正“理解”文字的规律。它只是死记硬背了文字在像素层面上的长相。

一张与奥特曼谈生意的图暴露了这一点：两箱饮料包装上大大的“蒙牛”和“王老吉”写得极其完美，底下的小字却依然是模糊的色块。

图源：https://cdn3.linux.do/original/4X/d/7/c/d7c4fb063202bcbf56b9ca0623aa0ce6fc26e542.jpeg

在现有技术范式下，生成逻辑还是“按像素排布”，离“按字符渲染”差着本质的一步。极细微处的乱码，可能永远无法彻底根除。

但话说回来，对90%以上的商业应用场景而言，这已经足够了。

尚未封神的缺陷与边界

即便已经坐上世界第一的宝座，GPT-Image 2也有它笨拙的一面。

实测中发现，由于思考模式会调用联网搜索并进行逻辑推演，在处理极其复杂的虚构任务时，模型偶尔会陷入逻辑怪圈——思考了接近40分钟，仍然无法作答。

与此同时，API宣称的支持2K甚至4K分辨率，意味着极高的token消耗和延迟。

对于普通用户来说，如何在极致画质和响应速度之间取得平衡，是未来使用中的必修课。

在技术领域，强大的能力永远是一把双刃剑。

无论是图像模型还是视频模型，都不可避免地要面对深度伪造的伦理挑战。

目前的大部分实测案例中，AI生成的都是知名人物，但若是将他们换成各种社交媒体上发布过照片的普通人，在不认识本人的情况下已经极难分辨出真假。

除了背景中偶尔出现的乱码可能会让AI露馅，人体本身已经没有任何破绽。

因此，那些曾经必须由真人完成的领域，正在面临着前所未有的信任危机。

GPT-Image 2的发布，让生图模型从玩具走向了生产力工具。

过去人们用AI提供灵感，而如今的AI开始尝试接管从构思、计算、排版到成品的全流程。

对于设计从业者来说，这是一个充满FOMO的时代。

但对于那些善于利用工具、具备产品审美和逻辑思维的人来说，这又是一个最好的时代。

图像开始学会思考，文字不再是像素的杂音。

人们距离那个所思即所得的视觉奇点，可能真的只有一步之遥了。

本文来自转载硅基星芒，观点仅代表作者本人，发现AI平台仅提供信息存储空间服务。
如若转载，请联系原作者；如有侵权，请联系编辑删除。

赞 (0)

资讯组小编

微信扫一扫

微信扫一扫

警惕Token福利陷阱

上一篇 2026年4月23日下午2:20

灵光闪应用创作者激励计划第一期（2026 4.20 -5.20）

灵光闪应用创作者激励计划第一期（2026 4.20 -5.20）

下一篇 2026年4月23日下午2:45

扫码关注我们，了解最新AI资讯~

新闻

5.1亿！Hermes开发商被曝新融资，估值冲上百亿

资讯组小编
2026年7月15日
新闻

AI后进生王兴，为何与元宝搭伙

资讯组小编
2026年6月2日
新闻

AI医疗赛道挤满互联网大厂

资讯组小编
2026年6月23日
新闻

25岁小伙用AI自配中药调理身体：致气血紊乱、严重失眠

资讯组小编
2026年5月26日
新闻

宇树机器人要登珠峰了！

资讯组小编
2026年6月15日
新闻

Mythos引全球哄抢！巨头两周烧光百万美元

资讯组小编
2026年6月2日

发表回复

登录后才能评论

美男子起诉OpenAI：ChatGPT误判病情致肺栓塞
1小时前
分享到:

2025年7月，美国佛罗里达州55岁前牧师斯科特·温特斯因听从ChatGPT建议延误就医，导致双肺血栓引发大面积肺栓塞，一度病危。他于2026年7月21日在加州旧金山高等法院起诉OpenAI及CEO萨姆·奥尔特曼，指控其AI提供无证医疗建议、淡化症状严重性，并以信仰话术强化错误决策。诉状称，ChatGPT-4o在多次咨询中逐步放弃就医提醒，反而建议久坐静养，最终致其丧失工作与住房。原告要求经济赔偿并暂停ChatGPT Health服务。OpenAI回应强调AI不可替代专业医疗。
微软发布两款自研AI模型MAI-Image-2.5-Pro与MAI-Voice-2-Flash
1小时前
分享到:

7月23日，微软宣布推出自研AI模型MAI-Image-2.5-Pro和MAI-Voice-2-Flash，进入公开预览阶段。前者面向高质量图像生成，优化文字渲染与自然语言编辑；后者专注高并发语音交互，速度提升2倍、成本降32%。两款模型均基于微软自有数据训练，不依赖第三方蒸馏。MAI-Image-2.5-Pro已集成至Bing Image Creator、PowerPoint及OneDrive；MAI-Voice-2-Flash已用于Dynamics 365 Contact Center及Azure Voice Live服务。
苏姿丰称开源AI有益生态，AMD第二代AI服务器量产
1小时前
分享到:

2026年7月24日，AMD CEO苏姿丰在公开演讲中表示开源AI模型具有透明度与可控性优势，强调其在AI生态中的关键地位，并呼吁审慎管理而非限制。同日，她宣布公司第二代AI服务器已全面投入生产，预计于第三季度末出货，该系统为AMD首款支持大规模前沿模型训练与推理的机架式AI平台，当前客户需求强劲。
OpenAI升级ChatGPT健康功能，接入苹果健康与医疗记录
1小时前
分享到:

7月23日，OpenAI宣布升级ChatGPT Health功能，面向美国18岁以上已登录用户（含Free、Go、Plus及Pro订阅者）开放。该功能支持接入苹果健康（Apple Health）数据及One Medical、Function Health等多家美国医疗机构的电子病历。用户可授权ChatGPT分析健康趋势，如睡眠、运动及就诊后变化，并辅助理解医学术语、准备问诊问题。OpenAI强调，健康数据与对话均加密存储，不用于模型训练或定向广告。此举旨在提升用户健康管理效率。
黄仁勋力挺中国AI开源模型
1小时前
分享到:

据美国媒体当地时间22日报道，英伟达公司创始人兼首席执行官黄仁勋在接受采访时谈及中国人工智能发展，称中国开源AI模型非常优秀，美国不应惧怕中国的开源AI模型。黄仁勋表示：“这些中国大模型非常出色，出色的开源大模型应该得到使用。我认为，优秀的开源AI大模型对整个行业大有裨益。”多家外媒指出，中国快速推出高性价比的AI模型，打破了此前业界对中美AI技术差距的共识，给硅谷带来了极大的震撼。
Anthropic酝酿特殊方案，拟在上市后安排员工出售所持股票
1小时前
分享到:

两名知情人士透露，随着 Anthropic 筹备上市，公司正考虑一项十分罕见的举措：要求普通员工按照固定交易时间表出售股票，以此规避内幕交易相关法律风险。一名知情人士表示，Anthropic考量该方案，目的是企业上市后，继续维持内部信息自由流通的企业文化。Anthropic 管理层与外部顾问针对强制推行该交易计划的磋商仍存在变数，目前尚无法确认公司是否已经作出最终决定。
马斯克呼吁AI公司携手合作自我审查安全问题，为此可以暂时放下与奥特曼个人恩怨
1小时前
分享到:

美国科技亿万富翁埃隆·马斯克表示，他希望最先进的AI模型在发布前接受同行之间的审查，而不是由政府来负责审查。马斯克本人承认，领先的人工智能公司之间的合作需要他与OpenAI首席执行官萨姆·奥特曼放下分歧，尽管两人最近在社交媒体上曾有过激烈交锋。
Stripe据悉洽购AI模型聚合平台创企OpenRouter
1小时前
分享到:

据报道，支付公司Stripe正洽谈收购AI模型聚合平台创企OpenRouter，可能很快宣布达成交易，但洽谈仍可能破裂或出现其他竞购者。OpenRouter此前估值约13亿美元，若达成收购协议，其估值可能达到约100亿美元。
红果短剧发布AI剧角色创作规范
11小时前
分享到:

2026年7月22日，红果短剧发布《关于规范AI剧角色创作的公告》，明确角色差异化与版权合规双标准。公告要求主要角色须具高辨识度，杜绝‘高频AI脸’复用；严禁未经授权使用他人独创角色、造型及美术作品。平台将于近期开展专项治理，整治AI脸复用、内容同质化及素材违规问题，并已提升都市情感等品类AI仿真人剧准入门槛，强化画面衔接、表情变化等质量审核。
马斯克：AI发展不可逆，不应按下停止按钮
11小时前
分享到:

2026年7月，埃隆·马斯克在接受《经济学人》采访时指出，人工智能与机器人发展势头不可逆转，即便存在10%–20%的灾难性失控风险，人类也不应阻止其进步。他预测AI将在约五年内超越人类整体智慧，有望带来全民富足时代。马斯克强调，人类难以长期掌控超级智能，关键在于赋予AI正确价值观。他建议全球头部AI公司负责人定期召开安全协调会议，以实现相互监督与制衡。

【腾讯云】 4核4G服务器新客 38元/年起，支持 OpenClaw/Hermes 等热门镜像；Token Plan 低至28元/月，多种主流模型极速调用