How to prompt Seedream 5.0

TL;DR · AI 摘要
Seedream 5.0 通过美学理解和基于示例的编辑功能,能够生成高质量且风格多样的图像。
核心要点
- Seedream 5.0 能理解摄影语言并生成逼真的照片效果。
- 基于示例的编辑功能简化了复杂图像修改的过程。
- Seedream 5.0 处理多种摄影类型,包括肖像、风景和静物。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Seedream 5.0 图像生成
金句 / Highlights
值得收藏与分享的关键句。
Seedream 5.0 生成的图像具有极高的细节水平,能够模拟不同摄影设备的效果。
基于示例的编辑功能允许用户通过提供一对图像来指导模型进行复杂的图像修改。
标题:如何提示 Seedream 5.0 - 复制博客
URL 来源:https://replicate.com/blog/how-to-prompt-seedream-5
发布时间:Wed, 22 Apr 2026 04:14:23 GMT
Markdown 内容: 字节跳动的 Seedream 系列一直在进步。我们花了很多时间向它发送提示。以下是我们发现的内容。
美学
在深入探讨之前,让我们先谈谈这些图像实际上看起来如何。Seedream 5.0 生成了真正美丽的输出——那种你会放大来看细节依然清晰的图像。
一张受彩色胶片启发的年轻人侧面肖像,浅景深模糊了周围的元素,使他的眼睛成为焦点。细腻的颗粒感和色调暗示着高ISO胶片,而大光圈镜头则营造出运动模糊效果,增强了自然纪录片风格的真实感。

该模型在深层次上理解摄影语言。你可以引用特定的胶片类型、镜头特性以及照明设置,它会以感觉像是从该设备拍摄的图像来回应。
一位站在东京小巷中的女性,黄昏时分,霓虹灯映照在湿漉漉的地面上。使用过期的柯达Portra 800胶片拍摄,并推高两个档位。来自拉面店的钨丝灯光温暖地洒在她的脸上,而霓虹灯则在她的头发上投射出冷色调的青色高光。可见的颗粒感,光源周围有晕光,黑色略微提升。她正处在两步之间,仿佛处于两种色彩的世界中。

不仅仅是肖像。风景、静物、建筑摄影——该模型处理所有这些都表现出一种有意而非通用的品味。
冰岛冰川河流与火山黑沙交汇处的航拍照片,形成了抽象的分支图案,看起来像血管或闪电。在黄金时刻从3000英尺高空拍摄,水道在玄武岩沙地上发出蓝绿色的光芒。无法确定尺度——这可能是毛细血管的显微镜图像,也可能是三角洲的卫星照片。使用大画幅相机,极高锐度,没有地平线。

一颗半吃掉的石榴放在粗糙的石灰石表面上,由高窗射入的一束午后光线照亮。文艺复兴时期的明暗对比照明——种子在深影中闪闪发光,如同红宝石一般。一些种子滚到了石头上,留下了小小的红色痕迹。氛围介于卡拉瓦乔和现代食品编辑之间。

一位老渔夫在破旧的木码头上修补渔网,黎明时分。他的手是焦点——疤痕累累,被太阳晒黑,在淡蓝色的尼龙网中熟练地移动。他身后,海面呈现出从铅灰色到玫瑰金色的柔和渐变。使用徕卡M系列相机搭配50mm Summilux镜头全开光圈拍摄,背景虚化将港口灯光变成了完美的圆形。这张照片具有塞巴斯蒂昂·萨尔加多肖像的宁静尊严。

雨后,一滩完全静止的水面上倒映出一座粗野主义混凝土建筑,形成了一种类似瑞克施赫测试的对称性。建筑的几何立面——重复的矩形窗户和裸露的混凝土——在水中形成了一个抽象的图案。一个撑着红伞的人沿着边缘行走,这是场景中唯一的颜色。阴天,平坦的散射光,建筑摄影带有倾斜移轴镜头的效果。

基于示例的编辑
这是最难解释但最有趣的特性。
与其试图用文字描述复杂的编辑,你只需向模型展示你想要的结果。给它一对前后图像——图像1和图像2——然后提供第三张图像。模型会找出前两张图像之间的变化,并将其应用于第三张图像。
以下是一个例子。我们从一个普通的白色陶瓷杯开始,然后向模型展示这个杯子经过日本金继裂纹修复的样子(没有任何文字描述)。然后我们给它一个完全不同对象——一个陶瓷花瓶——并要求它应用相同的变换:
参考图像1到图像2的变化,将相同的操作应用于图像3
图像1

图像2

图像3

结果

模型通过杯子对学习了“添加金填充裂纹的金继模式”,然后在没有我们用文字描述金继外观的情况下,将同样的处理应用于花瓶。
这种方法适用于各种类型的变换:
- 材质替换:在一个对象上显示木头 → 大理石,应用到另一个对象
- 场景变化:在一个照片中显示白天 → 夜晚,应用于完全不同的地点
- 风格转换:显示一张照片转换成浮世绘木版画,将相同的艺术变换应用于新场景
风格转换
这里的力量在于你不需要找出描述“那种特定的广重色彩调色板”的正确词汇。你只需要展示即可。
以广重风格的传统日本浮世绘木版画重新构想这个场景——平面视角、粗线条轮廓、靛蓝、朱红和赭石的有限色彩调色板。
输入

输出

调整颜色分级以匹配以下效果——饱和的青绿色阴影、温暖的琥珀色高光、柔和的散射效果。
输入

输出

逻辑推理
大多数图像模型会将您的提示视为关键词的集合。Seedream 5.0 实际上会通过您所请求的内容进行推理。
一个鲁布·戈德堡机械装置:一个小球从木质斜坡滚下,击倒一排多米诺骨牌,最后一块多米诺骨牌拉动一根绳子,使一个浇水壶倾斜。水填满一个放在天平上的小杯子,这使得天平下降并拉动杠杆,从而敲响一个小铜铃。每个组件都投射出物理正确的阴影。小球正在滚动中。该机械装置放置在一个带有可见网格纸的绘图桌上。采用交叉影线风格,就像活生生的专利图纸。

它扩展到了理解机械层面的物理对象:
一块古董怀表被拆解并放置在黑色天鹅绒上,采用爆炸视图排列。每个齿轮、弹簧、擒纵轮、平衡夹板和宝石轴承都清晰可见,并且相对于它们在组装运动中的位置正确放置。主发条部分松开。用铜版手写体的小标签标识每个部件。博物馆级保护摄影风格。

带图像输入的多步推理
给模型两个图像和一个复杂的指令,它可以推理出多步骤操作。这里我们给它一个混合花束和三个空花瓶,并要求它按类型对花朵进行分类:
将图像 1 中的花朵按品种分类并分别放入图像 2 中的三个花瓶中。第一瓶放玫瑰,第二瓶放向日葵,第三瓶放薰衣草。
图像 1

图像 2

结果

模型必须识别每种花的类型,将它们分组,然后将它们分配到正确的容器中……所有这些都来自一个单一的提示。
看看更多你可以尝试的酷炫功能:
生成它们长大后的样子。
输入

输出

一只帝王蝶的完整变态过程,分为四个阶段从左到右排列:一条条纹毛虫吃着乳草叶,一个翡翠绿的蛹带有金色斑点,蛹裂开露出部分翅膀,一只完全展翅的蝴蝶。每个阶段都有优雅的衬线标签注释。以 17 世纪博物学家玛丽亚·西比拉·梅里安的插画风格呈现,但具有现代科学准确性。

精确指令遵循
Seedream 5.0 的指令遵循明显比以前的版本更紧密。当你提到“蓝色夹克”时,你会得到一件蓝色夹克——不是紫色,也不是青绿色。当你指定空间关系、数量或具体细节时,模型会尊重这些要求。
这对于具有许多特定要求的复杂构图尤为重要:
一个超现实主义的杂乱无章的高级软件工程师办公桌。打开的 MacBook Pro 显示一个终端窗口,绿色字体在黑色背景上滚动。一个陶瓷杯上写着“console.log('coffee')”,字体为等宽字体,蒸汽袅袅上升。一本打开的 O'Reilly 书展示了一个由三个重叠圆圈组成的维恩图,分别标记为“前端”、“后端”、“运维”。三张贴纸形成一个看板:黄色(待办事项)、橙色(进行中)、绿色(已完成),每个贴纸上都有小小的手写字任务。一个带有定制键帽的机械键盘,一部显示 Slack 通知的智能手机。一个形状像骷髅的小多肉植物放在混凝土盆中。金色时刻的光线从右侧照射过来,投下长长的阴影。

这是一条包含十几个具体要求的提示——马克杯上的文字、书中带有标签的图表、颜色编码的便利贴、一个头骨形状的花盆。模型会跟踪所有这些细节。
模型还可以处理视觉线索。如果您的图像中有箭头、边界框或标记特定区域的彩色区域,您可以在提示中引用它们:
根据喷漆标记布置这个阁楼。将一幅大型抽象表现主义绘画放在墙上的红色矩形处。将一张中世纪现代皮革沙发放在地板上的蓝色矩形处。将一盏黄铜球形吊灯挂在天花板上的黄色圆圈处。移除喷漆标记。保留工业风格。
输入 — 带有喷漆标记的阁楼

输出

领域知识
Seedream 5.0 在多个专业领域内具有深厚的内置知识。这不仅仅是“知道建筑是什么样子”——它理解技术内容的结构和惯例。
给它一份平面图草图,它会生成尊重空间布局的真实感可视化效果:
根据这份平面图,生成一个逼真的室内渲染。一座日式极简主义风格的房子,使用温暖的桧木色调,中央有一个庭院花园,通过落地玻璃窗可以看到一棵红枫树,榻榻米地板,一个带有斑驳午后阳光的木制缘侧。滑动障子屏风部分打开。完全匹配布局。
输入 — 建筑师的草图

输出

模型可以生成通常需要专业知识和仔细工作的科学插图:
一幅详细的珊瑚礁生态系统横截面图,采用科学插图风格。下方:火山玄武岩基底。中间:可见化石层的碳酸钙珊瑚礁结构。上部珊瑚礁:一个繁荣的生态系统,标有物种名称——鹿角珊瑚、脑珊瑚、海葵中的小丑鱼、裂缝中的鳗鱼、鹦鹉鱼在吃食、海龟在上方游泳。水线以上:一个小热带岛屿,长着棕榈树。左侧边缘有深度标记。精确的线条工作,水彩填充,优雅的衬线字体标签。以《自然》杂志的风格发表。

给模型一张食物的照片,并要求它添加营养信息注释:
识别这盘拼盘中的每道菜,并在每道菜旁边添加优雅的手写书法注释卡,显示菜品名称和每100克的热量。卡片使用奶油色纸张,用勃艮第墨水书写。
输入

输出

文本渲染
自3.0版本以来,Seedream在文本渲染方面表现出色,5.0版本延续了这一传统。使用双引号包围您希望在图像中呈现的文本,以获得最佳效果:
一张虚构爵士音乐节的大尺寸排版海报。顶部用粗体压缩无衬线字体:“BLUE NOTE SESSIONS”,深海军蓝。下面用优雅的手写体:“2026年夏季 — 纽约中央公园。”海报列出了四位表演者:“迈尔斯·艾德前五重奏 / 星期六晚上8点”“陈三重奏 / 星期六晚上10点”“蒙克复兴 / 星期天晚上7点”“科特兰遗产管弦乐队 / 星期天晚上9点”。右侧边缘有一条垂直的金色萨克斯风轮廓。背景是从午夜蓝到温暖琥珀色的渐变。底部用小写字母:“门票在bluenote.nyc — 所有人欢迎。”

这是一张包含多种字体、大小写混合、标点符号、特定表演者名称以及渐变背景的海报——所有内容都准确地呈现出来。模型也能很好地处理多语言文本。如果您需要准确地渲染中文、日文、韩文或其他脚本,Seedream 5.0 可以做到。
多图像生成
像Seedream 4.5一样,5.0版本的模型可以一次性生成多个相关图像。请求“一系列”或“一组”图像,或者指定数量,它会产生具有连贯风格和角色连续性的图像。
一个电影风格的2x2故事板网格。面板1:废弃的空间站内部,一名孤独的宇航员漂浮在一个藤蔓穿过破裂船体的走廊里,生物发光真菌发出蓝色光芒。面板2:她发现了一扇密封的实验室门,磨砂玻璃后面有一个脉动的绿色灯光,伸手去拉手动释放杆。面板3:门打开,露出一个生机勃勃的花园,一棵零重力生长的小树,根部螺旋向外延伸,像水母一样。蝴蝶定格在飞行中。面板4:她的脸通过头盔面罩的特写镜头,眼泪悬浮成小球,花园倒映在她的眼睛里。一致的角色设计,变形镜头光晕,雷德利·斯科特色彩调色板。

为名为“ALTITUDE”的特种咖啡烘焙商设计的全面品牌识别平面图。在深色石板上排列:哑光黑色咖啡袋,上面有压印金色箔片的“ALTITUDE”标志,以及等高线logo;名片(正反两面)、带有蚀刻等高线logo的陶瓷手冲滴漏壶、印有品牌标志的牛皮纸贴纸、印有品牌标志的亚麻购物袋、激光雕刻品牌标志的金属旅行杯,以及一本名为“冲泡指南”的小册子。配色方案为黑色、金色和天然牛皮色。俯拍产品照片,均匀的室内照明。

这对于故事板、品牌识别套件、表情包集以及任何需要一组连贯内容的场景都非常有用。
使用 API 开始
以下是使用 JavaScript 和 Replicate API 运行 Seedream 5.0 的方法:
import replicate from "@replicate/python";
const version = "xenova/seadream:5.0";
const input = {
prompt: "A girl in a lavish dress walking under a parasol along a tree-lined path, in the style of a Monet oil painting",
};
const output = await replicate.run(version, { input });import replicate
version = "xenova/seadream:5.0"
input = {
"prompt": "A girl in a lavish dress walking under a parasol along a tree-lined path, in the style of a Monet oil painting",
}
output = replicate.run(version, input=input)提示技巧
在测试过程中我们学到了一些东西:
- 使用自然语言,而不是关键词列表。 “一位穿着华丽礼服的女孩在树荫下的小径上打着伞行走,就像莫奈的油画一样”比“女孩、伞、树荫街道、油画纹理”效果更好。
- 使用双引号进行文本渲染。 如果你想在图像中包含特定文本,请用双引号包裹:
Design a poster with the title "Seedream 5.0"。
- 明确指出哪些部分不应改变。 在编辑时,告诉模型哪些部分不应该改变:“把帽子换成王冠,保持姿势和表情不变”。
- 使用视觉标记进行复杂编辑。 在输入图像上画箭头、方框或彩色区域,以精确指示应发生更改的位置。
- 指定您的应用场景。 告诉模型“为一家游戏公司设计一个标志”比仅仅描述视觉元素得到更好的结果。
- 对于基于示例的编辑,展示而不是讲述。 当难以用文字描述转换时,提供一对前后示例。