用AI创作手办照片:从灵感到提示词模板的实战案例
昨天分享的关于如何写提示词模板的帖子,主要提供了一些理论上的说明和一个实际案例。今天再补充一个案例,介绍如何以图片为基础作为参数,来设计提示词模板。
比如,我在 X 上看到一张很有意思的图片,是真人和手办合影的照片。当时我就在想,是不是能够实现上传一张照片后,AI就自动生成同样姿势的手办与真人同框合影?

我手边已经有一个用于生成手办的提示词:
hatsune miku cherry blossom edition anime figurine on a desk, casual shot as if from a smartphone, pastel pink hair, pastel pink and white clothes
按照上一篇文章的思路,下一步就是借助 AI 帮我设计更适合的提示词。
于是我将参考提示词和照片一起提交给了 ChatGPT:
[ref] hatsune miku cherry blossom edition anime figurine on a desk, casual shot as if from a smartphone, pastel pink hair, pastel pink and white clothes [/ref] 参考上面的提示词,帮我设计一段中文提示词,可以根据我上传的人物照片,生成照片人物的相同姿势的手办,并且类似图片中在同框照片中。
ChatGPT 帮我写了一个初版提示词:
生成一个以真实人物照片为基础的手办模型,保持与照片中人物完全一致的姿势、表情和服装造型,风格精致细腻,头发和服装具有自然柔和的渐变色彩与细节质感,整体风格偏向日系动漫手办风。最终呈现为一张真实人物与其对应手办模型同框合影的效果图,人物摆放位置、构图布局及光照氛围与参考图片相似,画面视觉风格亲切生动、充满动漫感。

接下来我立刻进行了测试,发现这个提示词对照片本身的要求比较高,普通的生活照片效果一般。比如我随手找了张剧照进行测试:

结果显示,生成的手办效果倒是不错,但真人部分与原始照片差距较大,存在失真现象。
这其实也是目前 AI 生成图片的常见问题:当参考图是真人的时候,生成效果往往不够理想。既然如此,我们可以灵活变通一下思路,干脆去掉真人部分,只生成对应的手办。
于是我手动调整了提示词,删除了原提示词的后半部分:
生成一只摆放在桌面上的动漫手办,手机随手拍的休闲视角;以附件人物照片为基础的手办模型,保持与照片中人物完全一致的姿势、表情和服装造型,风格精致细腻,头发和服装具有自然柔和的渐变色彩与细节质感,整体风格偏向日系动漫手办风。
再次测试,效果明显改善:

但接下来我测试更多照片时,又遇到了新的问题:如果上传的是半身照,那么生成的手办也只显示半身,这样显然不是我想要的效果。

虽然我可以手动继续调整,但我第一反应依旧是让 AI 来帮我。于是我把之前的提示词和新需求提供给了 ChatGPT:
[ref] 生成一只摆放在桌面上的动漫手办,手机随手拍的休闲视角;以附件人物照片为基础的手办模型,保持与照片中人物完全一致的姿势、表情和服装造型,风格精致细腻,头发和服装具有自然柔和的渐变色彩与细节质感,整体风格偏向日系动漫手办风。 [/ref] 完善上面的提示词,让它保证手办是全身完整的。
这一次 ChatGPT 给我生成了一个新版本:
生成一张摆放于桌面上的动漫风格手办照片,以日常随手用手机拍摄的轻松休闲视角呈现。手办模型以附件中人物照片为基础,精确还原照片中人物的全身姿势、面部表情以及服装造型,确保手办全身完整呈现。整体设计精致细腻,头发与服饰采用自然柔和的渐变色彩与细腻质感,风格偏向日系动漫风,细节丰富,质感真实,观感精美。
值得一提的是,这里我并未继续之前的AI对话,而是新开了一个会话,因为此前我对提示词做过一些人工调整,如果继续之前的会话,会导致新提示词受到过往上下文的干扰,不如明确上下文后新建会话,这样效果更好。
再次测试,效果果然很好:

之后我用其他照片做了更多测试,效果都非常不错,说明现在的提示词模板已基本稳定,可以投入实际使用了。

当然,从提示词优化的角度来说,这个结果可能并非最精简的版本,也有网友提出可以更简洁。但本文的重点在于分享AI创作过程中的灵感与实践,希望带给你启发:
从日常生活中寻找灵感,并尝试与 AI 技术结合,比如我看到有趣的照片就会想到用AI进行类似创作尝试;
做任何事情之前,我首先会想 AI 能否帮我完成或优化,因此我习惯用 AI 协助写提示词、调整提示词,大大降低了项目启动门槛与优化效率;
强调人主导AI,而非过度依赖。AI 无法替你产生创意、主动发现问题或调整方案,但只要你具备好的创意与执行力,AI 会帮你事半功倍。
以上就是一个小小案例,却体现了我日常如何借助 AI 进行高效创作的过程,希望对你也有所启发!