用 GPT Image 2 画了 100 张图后,我总结出这 5 条提示词规律(附 10 个可直接复用的模板)

网上关于 GPT Image 2 的功能介绍和 API 接入教程已经很多了,这篇不重复那些内容。 我只做一件事:把这段时间实测下来效果最好的 10 个提示词整理出来,每个都附真实出图,告诉你为什么有效、怎么改成你自己的。 …

网上关于 GPT Image 2 的功能介绍和 API 接入教程已经很多了,这篇不重复那些内容。

我只做一件事:把这段时间实测下来效果最好的 10 个提示词整理出来,每个都附真实出图,告诉你为什么有效、怎么改成你自己的。

先说结论——GPT Image 2 和之前所有文生图模型最大的区别在三个点:

  1. 长提示词不崩。200 字以上的详细描述,它能稳定执行,不会像早期模型那样越长越乱。
  2. 图里的文字真的能看。海报标题、UI 界面里的中文,渲染出来基本可读,这是质的飞跃。
  3. 中文提示词效果好。不需要强行翻译成英文,直接写中文,出图质量不打折。

下面进入正题。

一、5 条核心规律

在看具体案例之前,先记住这 5 条,它们是所有好提示词的共性:

1. 写明相机和胶片型号

“35mm film photography”“anamorphic lens”“shot on iPhone”——这类表述能一秒锁定整体视觉气质。GPT Image 2 对具体相机型号的”质感直觉”很强,点名它们就能省下大量描述。

2. 光线必须写

“机顶硬直闪”“窗边柔和漫射光”“春日金色逆光”“冷青调环境光”——光线词对画面情绪的影响远超主体描述。不写光线,画面立刻变平。

3. 指定画幅和取景

除了 API 层面的尺寸参数,提示词里也可以写”9:16 竖版”“16:9”。复杂场景还要描述取景方式:”亲密中景”“极低机位仰拍”“越过肩膀的微仰角”。

4. 用一句话锚定风格

不要只描述画面里有什么,直接说出视觉门类:”电影感动漫主视觉”“1960 年代旅游海报风格”“时尚大刊编辑摄影”“超现实数字插画”。一句风格锚定比十个形容词有效。

5. 加入文化和情境细节

GPT Image 2 对文化梗的理解深度令人惊讶。”宋代文人”“圣斗士黄金圣斗士”“Beacon Hill 红砖联排”“阿马尔菲的柠檬”——能用具体专有名词的地方就别用泛泛的说法。

二、10 个实测提示词(附出图 + 解读)

1. 柔光通透 35mm 胶片人像

提示词:

Analog 35mm film photography, soft airy Japanese-style aesthetic, gentle diffused natural window light, slight overexposure, pastel tones, low contrast, soft highlights, minimal indoor setting near a window with white curtains, clean light-colored wall, natural composition, eye-level, slightly closer full-body framing (mid-thigh to head), young East Asian woman, natural minimal makeup, soft realistic skin texture, long slightly messy dark hair, oversized white button-up shirt, light casual shorts, barefoot, simple and relaxed styling, standing naturally with relaxed posture, arms loosely at sides or slightly behind, facing camera, gentle soft smile, subtle stillness, focus on light, air, and quiet everyday mood, soft film grain, dreamy and understated atmosphere

为什么有效: 在描述人物之前,先用三个信号叠出了”日系胶片”气质——35mm 胶片、窗光柔光、轻度过曝。光线和胶片先把氛围立起来,人物只是融入其中。

怎么改: 把人物换成男生、孩子、情侣甚至静物都成立,因为魔法在”35mm + 窗光”的组合上。

2. 高级感美妆人像

提示词:

Luxury Glam Beauty Portrait: Beautiful Black woman, youthful spirit, creamy vanilla, silk press, mahogany red, subtle confidence, textured fabric, sapphire blue, minimal jewelry, beachside breeze, lens flare effect, nostalgic, cinematic lens, symmetrical composition, soft focus, high fashion photography, monochromatic, dewy finish, mysterious tension, layered elements

为什么有效: 和上一条完全相反的写法——不是流畅长句,而是逗号分隔的”时尚标签流”。GPT Image 2 两种写法都能消化。标签流的优势是,当你已经掌握了审美词汇,可以快速堆叠情绪。”monochromatic”和”lens flare effect”是把整张图拽向 80 年代香水广告调子的关键词。

3. 波士顿城市海报(图内文字渲染示范)

提示词:

A striking Spring 2026 city poster for Boston with an elegant celebratory mood and a bold contemporary design. On a clean off-white textured background with large areas of negative space, a miniature single sculler rows across the lower right corner of the image on a narrow ribbon of reflective water. The wake from the oar sweeps upward in a dynamic calligraphic curve, gradually transforming into the Charles River and then into a dreamlike hand-painted panorama of Boston. Inside this flowing river-shaped composition are iconic Boston elements: the Back Bay skyline, Beacon Hill brownstones, Acorn Street, Boston Public Garden, Swan Boats, Zakim Bridge, Fenway-inspired details, historic brick architecture, harbor ferries, and the city's waterfront atmosphere. Soft morning fog, golden spring light, subtle festive accents in crimson and gold, rich detail, layered depth, sophisticated city-poster aesthetics, fresh and refined, visually powerful but not overcrowded. Elegant typography in the lower left reads "SPRING 2026" with a vertical slogan "BOSTON, A CITY OF RIVER, MEMORY, AND INVENTION", text clear and beautifully composed, premium graphic design, 9:16

为什么有效: 这条是构图提示词的标杆。它不只说”画面里有什么”,而是描述了几何流向:”桨痕从右下方腾起,化为书法弧线,逐渐变成查尔斯河”。GPT Image 2 忠实地把这条弧线画了出来,版面里的文字也干净地排了进去。

怎么改: 把城市名和地标换掉,这套骨架就能套用到任何城市。

4. 复古阿马尔菲旅行海报

提示词:

Modern pencil illustration of Vintage travel poster illustration of the Amalfi Coast, Italy, panoramic coastal cliff road scene, classic 1960s white car driving along a curved seaside road, deep blue Mediterranean sea with small sailboats, colorful pastel hillside village, bright blue sky with soft clouds, lemon tree branches with vibrant yellow lemons framing the foreground, warm summer sunlight, bold vibrant colors, retro 1950s travel poster style, cinematic composition, high detail, screen print texture, graphic illustration. Hand-drawn style, illustration with loose strokes and defined contours. High-contrast color palette, maintaining chromatic harmony between background and elements. Contemporary and decorative aesthetic.

为什么有效: 点名一个具体年代(”1960 年代白色轿车”“1950 年代旅游海报风格”)远比说”复古”“怀旧”有效。”screen print texture”和”loose strokes and defined contours”把模型从写实推向插画。

怎么改: 阿马尔菲换成京都、马拉喀什、雷克雅未克,模板完美适配。

5. 业余视角 iPhone 发布会现场

提示词:

Amateur iPhone photo at Apple Park during the iPhone 20 keynote, Tim Cook presenting on stage. Shot from the crowd at a distance.

为什么有效: 不到 25 个英文单词,却能生成几乎可以冒充真实泄露照的图。关键在三个词:”amateur”“from the crowd”“at a distance”——它们暗示了略歪的取景、前景举起的手机、观众席真实拍摄的画质衰减。

适用场景: 任何想要”捡到的现场照”而非精修渲染的场景。

6. 宋朝人的朋友圈(中文渲染 + UI 模拟)

这条是我个人最喜欢的,也是最能体现 GPT Image 2 中文能力的案例。

提示词:

"宋朝人的朋友圈"/"SONG DYNASTY SOCIAL MEDIA FEED",古今穿越幽默融合界面设计风格,画面模拟手机社交媒体界面,但内容全部是宋朝场景头像是宋代文人画像,用户名"苏东坡SuShi_Official",发布内容"刚到黄州,被贬了但心情还行。今天自己做了东坡肉,味道绝了,附菜谱:",配图为工笔画风格的东坡肉特写,点赞列表"黄庭坚、秦观、佛印等126人",评论区"王安石:呵呵""司马光:还是那个味道",界面元素如点赞图标用宋代花纹替代,状态栏显示"大宋移动 5G"和"元丰三年",配色为手机深色模式搭配宋代雅致色调,历史与社交媒体的趣味碰撞杰作

为什么有效: 这条同时做了两件事——指定了一套 UI 结构(头像、动态正文、点赞列表、评论区、状态栏),又把每个槽位填上了极具文化特征的内容。GPT Image 2 把所有汉字都忠实渲染了出来,包括”大宋移动 5G”“元丰三年”这种反差萌。

关键经验: 想让画面里出现中文,直接用中文写整段提示词,字形会更干净。

7. 机甲少女 · 海上废城主视觉

提示词:

A mecha girl mid-teens, pale skin smudged with soot and salt spray, sharp amber eyes with glowing HUD reticles, waist-length ash-white hair tied in a high ponytail whipping in the sea wind, matte gunmetal exoskeleton armor plating her shoulders, forearms and shins, exposed hydraulic pistons at the joints, chest rig with glowing cyan coolant lines, oversized oil-stained hangar jacket half slipping off one shoulder, a massive rail cannon resting on her right shoulder, dog tags and frayed red ribbon at her collar, standing off-center to the left on the rusted edge of a tilted steel platform jutting out over dark water, weight shifted onto one leg, left hand gripping the cannon strap, head turned slightly toward camera with a quiet defiant stare, steam venting from her back thrusters, her ponytail and jacket streaming sideways in the salt wind, a vast derelict sea-city at dusk, colossal megastructures of unknown purpose rising from the ocean in staggered silhouettes, bone-white monolithic towers fused with barnacled steel, cyclopean ring-shaped constructs canted at broken angles, rusted skeletal gantries threaded with dead cables, dark swells rolling between the pylons, shipwrecks half-swallowed at their feet, thick sea fog clinging to the bases while the upper structures pierce into a bruised sky, scattered faint lights blinking high in the towers like distant eyes, moody low-key lighting, cold teal ambient from the overcast sky, warm amber sodium glow leaking from a distant structure camera-right, hard backlight from a low sun behind the towers carving her silhouette, volumetric god rays cutting through sea mist, wet specular highlights on her armor, 35mm anamorphic lens, slight low angle looking up past her shoulder toward the structures, medium-wide shot, shallow depth of field with foreground rust in soft focus, horizontal lens flares, fine atmospheric haze compressing the distant megastructures into layered silhouettes, cinematic anime key visual, painterly digital illustration with crisp line art, desaturated oceanic palette of teal, bone-white and rust punched by small warm accent lights, film grain, high-contrast editorial poster aesthetic.

为什么有效: 这是长篇提示词的金标准范例。注意它的顺序:角色 → 姿态 → 环境 → 光线 → 镜头 → 风格。每一段两到三句具体物理细节,单是光线段就有五个不同光源。GPT Image 2 全部忠实执行了。

关键经验: 做动漫主视觉级别的图,按”角色 → 姿态 → 环境 → 光线 → 镜头 → 风格”这个顺序写就对了。

8. 圣斗士黄金十二宫卡牌网格

提示词:

Generate a 12-card grid (3 rows x 4 columns) featuring the 12 Gold Saints of Saint Seiya, each in their signature golden zodiac armor with distinctive helmet design. Each card shows the saint in a heroic pose with their constellation symbol glowing in the background. Below each character, write the corresponding Chinese name in elegant calligraphy: 白羊座穆、金牛座阿鲁迪巴、双子座撒加、巨蟹座迪斯马斯克、狮子座艾欧里亚、处女座沙加、天秤座童虎、天蝎座米罗、射手座艾欧罗斯、摩羯座修罗、水瓶座卡妙、双鱼座阿布罗狄. Anime trading card aesthetic, dramatic lighting, vibrant gold and constellation-themed accent calls. Premium foil-card style finish.

为什么有效: 网格布局曾经是早期图像模型的痛点。GPT Image 2 在三个条件齐备时能稳稳画出来:明确写出网格尺寸(”3 rows x 4 columns”)、给每格一个清晰的主体身份、告诉模型每格下面写什么标签。

怎么改: 这套模式可以直接复用到角色档案、产品目录、情绪板、塔罗牌。

9. 锦鲤遨游星云

提示词(中文):

一幅超现实主义数字插画风格,采用低角度仰拍视角。画面描绘了一条巨型彩色锦鲤遨游在梦幻般的星云中,四周环绕着色彩鲜艳的星云与气泡。画面中央还站着一个小人,背对观众,神情平静地仰望空中这条巨大的锦鲤,锦鲤头向下看着小人。整体画面呈现出强烈的大小对比,氛围空灵又梦幻。比例9:16

为什么有效: 超现实图的成败几乎全在”尺度对比”上。这条把对比变成了核心指令(”巨型锦鲤……一个小人……强烈的大小对比”),并设计了视线互动(”小人仰望……锦鲤俯视”)。”尺度 + 视线”是超现实场景的可靠公式。

怎么改: 锦鲤换成鲸鱼、飞蛾、机械之眼,结构依然成立。

10. 手写笔记本实拍照

提示词:

Amateur photo of an open notebook lying flat, filled with handwritten notes in black ballpoint pen. The handwriting is casual and slightly messy, like personal notes, natural imperfections, crossed out words, underlined headings. Shot from slightly above, natural daylight from a window, no flash. Casual desk setting, shot on iPhone.

为什么有效: 手写字曾是图像模型最难伪造的元素。GPT Image 2 在你”允许它不完美”的时候反而画得最好——”随意微乱”“自然瑕疵”“划掉的词”。少了这些表述,模型会写出过分工整、一眼假的字。

三、怎么改造成你自己的提示词

把上面这些提示词当成骨架,对会变的部分做替换:

  • 换主体,留光线和镜头。 提示词 1 换成男性、孩子或静物同样成立。
  • 换专有名词,留结构。 提示词 3 把波士顿换成东京,构图方式保持不变。
  • 换年代,留媒介。 提示词 4 换一个词就能从 1960 年代变成 1920 年代装饰艺术风。
  • 跨提示词组合。 把提示词 7 的光线描述搬到提示词 1 的肖像骨架上,效果会很惊艳。
  • 拿不准就写更长。 GPT Image 2 对长提示词的遵循度好于绝大多数模型。出图平庸时,答案通常是更具体,而不是更简短。

四、用什么工具跑这些提示词

找到一个可以直接跑 GPT Image 2 的平台,叫 CubistAI,它有一个专门的 GPT Image 2 在线生成页面,把提示词贴进去就能出图,不用折腾 API。我上面这些图基本都是在这个页面上跑的,几个优点:

  • 不用自己调 API,浏览器打开直接用,手机也行
  • 新注册有 1 次免费试用 GPT Image 2 的机会,可以先体验一下效果
  • 之后继续用需要充积分,但价格比自己调 API 便宜(毕竟省了开发成本)
  • 除了 GPT Image 2 还有其他免费模型可以用,同一个提示词可以切换对比
  • 自带去背景、擦除、扩图这些编辑工具,不用再开 PS

说实话 GPT Image 2 本身调用成本就不低(OpenAI 官方 API 一张图也要几毛到几块钱),所以不管用哪个平台都是要花钱的。如果你有开发能力,直接调 API 也行,上面这些提示词贴进去就能用。但如果不想折腾环境,先用那个页面的免费次数试试效果再决定。

写在最后

GPT Image 2 确实是目前提示词遵循度最高的文生图模型,尤其在长提示词执行、图内文字渲染、中文支持这三个方面拉开了明显差距。

但再强的模型也需要好的提示词喂它。记住开头那五条规律:写明相机、写明光线、写明取景、锚定风格、叠上文化细节。掌握这五条,不管模型怎么迭代,你的出图质量都不会差。

希望这 10 个模板能帮你省掉一些试错时间。有问题评论区见。

特别声明:以上内容(如有图片或视频亦包括在内)为本平台用户上传并发布,本平台仅提供信息存储服务。