文章最后更新于 2025年6 月26日
想用AI做个系列故事,结果主角每张图都长得不一样,一秒”赛博毁容”,前功尽弃?别担心,你不是一个人!
AI模型天生就喜欢”放飞自我”,追求每一次的”全新体验”,这让角色一致性成了老大难问题。我将结合最强的AI工具、最骚的操作技巧和精心设计的”魔法咒语”(提示词),让你创造的AI角色不仅拥有一张”铁打的脸”,还能拥有连贯的”人设”和故事线。
记住一句真理:在AI内容创作领域,一致性和真实感约等于真金白银。无论你是想做电影、搞创意,还是当个酷炫的博主,掌握这个技能,你就领先了90%的人!
第一步:铸造你的角色灵魂(这是最最最关键的一步!)
一切的开始,在于一张完美的”出生证”—-也就是你的角色源图像,以及一份比户口本还详细的”角色档案”。
1. 工具与”第一张脸”的选择
- 神器推荐:我们首推 Image FX (Image N4),你可以在 Whisk AI 平台里找到它。优点是:出图清晰、保真度高,而且对提示词的理解能力超强,非常”听话”。
- https://labs.google/fx/zh/tools/whisk
- 选图黄金法则(敲黑板!):
- 大头贴特写:让角色的脸占满画面,AI才能”看清楚”并记住TA的五官细节。
- 表情清晰、正对镜头:别选奇奇怪怪的角度和看不清的表情,正面、清晰的脸是最容易保持一致的。
- 服装细节拉满:衣服的褶皱、材质、配饰都要看得清清楚楚,这些都是构成角色身份的一部分。
- 背景控制:想好你的背景是不是故事的一部分。如果不是,就让它模糊掉,突出主体。
2. 念出你的第一条”创世咒语”
要生成源图像,你的提示词必须足够细节。试试这种感觉:
“情绪化的,逼真的特写,一个模特的照片,在薄雾森林中,背景柔和模糊,远处城堡的微弱剪影在薄雾中可见,电影般的灯光,浅景深,自然的皮肤纹理。”
Gemini生成
3. 创建角色的”终极档案”
这是我们的核心秘籍!
- 将你生成的最满意的源图像导入到 Whisk AI,使用它的”主题 (Subject)“功能。Whisk AI会像个侦探一样分析图像,生成一份超级丰富的角色描述。
- 把 Whisk AI生成的描述 + 你最初的提示词 一起丢给一个大语言模型(比如 Gemini 或 ChatGPT)。
- 然后对它下达指令:”请根据以上信息,为我创建一个用于AI视频工具(如VEO3)的详细角色描述模板,目标是让角色在所有后续画面中保持外观一致。顺便给TA起个名,再来一段保持声音一致的语音提示词。”
搞定!现在你有了一份角色的”核心档案“或”角色圣经“。在之后的所有步骤里,你只需要无脑复制粘贴这份档案,就能确保角色的视觉(甚至声音)都稳如泰山。
第二步:导演你的第一场戏(构建连贯的故事场景)
有了固定的演员,我们就要开始拍不同的场景了。这里的核心方法论是:用第一步生成的”核心档案”作为基础,通过增添场景和动作描述来生成一系列连贯的图像。
- 实战流程:
- 回到 ChatGPT 或 Gemini,把你角色的”核心档案”喂给它。
- 让它帮你头脑风暴,围绕你的角色生成一系列不同场景、不同动作或不同角度的变体提示词。例如,你可以要求:”基于这个角色,帮我生成五个不同的场景提示词,包括’一张远景肖像’、’一张全身照’、’一张侧面奔跑的抓拍’和’一张航拍图'”。AI还能帮你写出一整套故事脚本,风格还能和你的第一张图完美匹配!
- 将这些”核心档案 + 新场景描述“组成的完整提示词,复制到你喜欢的AI图像生成工具中(例如第一步使用的Image FX),即可创造出一系列视觉上高度一致的图像序列。
专业技巧:像大导演一样思考! 别总用”站着”、”坐着”这种大白话。学会用专业术语,AI会更懂你!
- 镜头类型:”广角定场镜头 (wide establishing shot)”、”中景英雄镜头 (medium hero shot)”、”过肩镜头 (over-the-shoulder shot)”、”特写镜头 (close-up)”。
- 相机参数:描述相机角度、镜头选择、运动方式和光线,这些都能精准控制画面效果。
想给角色加个道具? 比如让TA手持一个产品?方法一样,直接在你的提示词里具体描述,例如,将”模特手持一个小红灯笼的逼真肖像”这样的细节,添加到你的”核心档案”之后。
第三步:让角色”动”起来!(AI视频生成)
- 平台选择:目前最火的AI视频vlog很多都是用 Google Flow VEO3平台生成的,记得在Prompt Builder里选择”V3 quality“以获得最佳画质。
- 编写”视频剧本”:
- 同样,让 ChatGPT 帮你。告诉它你的角色和故事,它就能生成V3专用的提示词。例如:”一个毛茸茸的、淘气的、性格滑稽的大脚怪,手持一个简易的Vlog相机(手机用胶带粘在树枝上),像YouTuber一样记录他的冒险。”
- 化整为零:V3目前一次只能生成8秒视频。所以,你需要把你的故事切成一个个8秒的小片段,为每个片段写好提示词。
- 紧急预案:AI”失忆”了怎么办? V3有时候会”犯傻”,比如你明明要拍大脚怪,它却给你生成了一个普通人。解决方法很简单粗暴:把我们第一步创建的”角色核心档案”复制并粘贴到每一条视频提示词的开头! 正确的格式永远是:【超详细的角色描述】+【角色在这一幕的行为】。
- 效率翻倍:Google Flow允许你同时生成多个视频片段
第四步:后期”美颜”,画龙点睛
素材有了,最后一步就是精加工,让你的作品达到专业水准。
- 图像高清化:生成的图片不够清晰?可以使用市面上许多免费或开源的”AI图像放大工具 (AI Image Upscaler)“来提升分辨率和细节。对于重要项目,寻找支持更高保真度模式的工具,效果会更惊艳。
- 烦人的字幕?一键搞定! VEO3生成的视频有时会自带字幕,非常碍眼。
- 方案一:Runway Inpainting。用画笔涂抹,但有时会留下一丢丢痕跡。
- 方案二(强烈推荐):CapCut(剪映)的AI移除。导入视频,在”视频”菜单里找到”AI移除”,用画笔在字幕上划拉一下,字幕就消失得无影无踪!
- 统一口音,声临其境 角色的声音也需要一致!如果VEO3生成的几段视频里口音不一样:
- 声音克隆:从效果最好的一段视频里截取10秒音频,用 ElevenLabs 的语音克隆功能创建一个专属的角色声音。
- 终极备用:如果克隆的声音还是有点问题,就用ElevenLabs的文本转语音功能,输入台词,自己调配一个最合适的语音,替换掉原来的音轨。
“高手”进阶心法(Golden Rules)
- 故事为王:技术只是工具,你想要讲述的故事和创造的氛围才是灵魂。
- 换个”脑袋”思考:把自己当成艺术总监、摄影指导,从视觉叙事的角度去构建你的内容。
- 拥抱试错:别指望一次成功,AI创作就是不断调整和测试的过程。
- 创意让你脱颖而出:大家都拍大脚怪vlog时,你拍个”《玩具总动员》里的胡迪vlog”,可能更容易火出圈。
- 抓住早期红利:像V3这样的新工具,早期往往有免费额度,这是你零成本创作和吸粉的黄金时期!
- 角色类型小贴士:现阶段,AI处理卡通或非真实人物的一致性,比处理真人的脸要更容易一些。新手可以从这里开始尝试。
总结
看吧,创建一致的AI角色其实是一个系统性的流程,一点也不玄学。只要你从一开始就锁定一个极其详细的”角色档案”,并把它作为所有创作的核心,再结合强大的AI工具进行迭代,辅以专业的后期处理,你就能轻松驾驭AI,创作出稳定、连贯、引人入胜的视觉故事。
现在,别再观望了,赶紧动手