AI 短剧 / 视频生成教程
简介:AI 视频生成已经从玩具变成实用工具。本文覆盖国内可用的主流平台注册与价格、15+ 分镜 Prompt 模板、角色一致性深度方案,并附一个"1 分钟古风女侠短剧"端到端实战案例。
1. 主流工具对比(2025 年)
| 工具 | 优势 | 局限 | 免费额度 | 专业版价格 |
|---|---|---|---|---|
| 快手可灵(Kling) | 运动流畅,写实风格强 | 创意风格较弱 | 每日 66 积分 | ¥66/月(专业版,积分×10) |
| 海螺 AI(Hailuo) | 人物一致性最佳,面部稳定 | 运镜较固定 | 每日有限次数 | ¥79/月 |
| 即梦 AI(Jimeng) | 字节系,剪映生态打通 | 时长较短(最长 10s) | 每日约 60 积分 | ¥68/月 |
| Vidu | 镜头感强,电影感好 | 国内访问有时不稳 | 新用户 80 积分 | ¥79/月 |
| Runway Gen-3 | 国际标杆,运动最自然 | 需翻墙,较贵 | 免费 125 积分 | Standard $12/月,Pro $28/月 |
| Sora | OpenAI 出品,叙事理解强 | 排队严重,限量 | 仅 Plus/Pro 用户 | Plus $20/月(有配额限制),Pro $200/月 |
国内首选:可灵 + 海螺组合(可灵做动态场景,海螺保持人物面部一致)
2. 平台注册与首次使用
2.1 快手可灵
1. 注册:https://klingai.com — 用快手账号一键登录(无需新注册)
2. 首次进入:左侧 "视频生成" → 选 "文生视频" 或 "图生视频"
3. 积分说明:
- 每日免费 66 积分(普通质量每次 10 积分,高质量 35 积分)
- 专业版 ¥66/月,积分变为每日 660 分
4. 模式选择:
- "标准模式":快(约 2 分钟),适合批量测试
- "专业模式":慢(约 5 分钟),用于正式出片
5. 时长选项:5s / 10s(专业版可选)2.2 海螺 AI(MiniMax)
1. 注册:https://hailuoai.com — 用 MiniMax 账号(邮箱注册)或手机号
2. 网页版 vs API 版:
- 网页版:直接上传图片/输入文字,无需代码
- API 版:开发者用,按调用次数计费(适合批量生产)
3. 核心功能入口:
- "角色一致性":上传 2-3 张参考图 → 系统自动锁定面部特征(★★★ 最重要功能)
- "图生视频":上传角色参考图 + 描述运动
4. 免费额度:新用户赠 200 积分(约可生成 10 段视频)2.3 即梦 AI(字节系)
1. 注册:即梦 App(iOS/Android)或网页 https://jimeng.jianying.com
- 抖音账号一键登录,PC/移动端各有独立界面
2. PC 版优势:更大的操作区域,便于调整 Prompt
3. 移动版优势:随时随地生成,与剪映打通更顺畅
4. 关键功能:
- "角色一致性"按钮(主界面右上角小人图标)→ 上传参考图后,所有帧保持同一角色
- 视频时长:3s / 5s / 8s(需积分)
5. 剪映联动:生成视频后直接点"在剪映中编辑",一键导入3. 制作全流程
剧本创作 → 分镜设计 → 角色参考图生成 → 视频片段生成 → 配音/字幕 → 剪辑合成第一步:剧本创作(AI 辅助)
短剧剧本结构:3 分钟 = 9 个场景,每场景 20 秒
帮我写一个3分钟短剧剧本,类型:[都市/古装/科幻]。
要求:
- 共9个场景,每场景描述控制在50字内(包含:画面内容、角色动作、关键台词)
- 第1场景必须有强钩子(让人继续看的悬念或冲突)
- 第5场景是情绪最高点
- 第9场景是反转或升华收尾
- 台词总量不超过50句,每句不超过15字
输出格式:
场景1:[画面描述] / [人物动作] / 台词:"..."第二步:分镜与提示词设计
每个场景转化为视频生成提示词(以可灵为例):
[镜头类型] + [主体描述] + [动作/表情] + [场景环境] + [光线/氛围] + [运镜方式]
示例:
"近景,25岁东方女性,黑色长发,微微回眸,嘴角带着神秘微笑,
背景是夜晚的霓虹街道,雨后地面反光,镜头缓慢推近,电影感"第三步:保持角色一致性(见第 4 节深度方案)
第四步:配音与字幕
免费工具:
- 剪映:AI 配音 + 自动字幕,国语/粤语/方言均支持
- 海螺 AI:可直接在平台内添加 AI 配音
台词要求:
- 每句台词不超过15字,便于配音节奏
- 情感标注:[哭泣]、[愤怒]、[轻笑](给配音AI参考)
- 停顿位置用"..."标明第五步:剪辑合成
推荐工具:剪映(见第 5 节详细操作)
4. 角色一致性深度方案
最关键环节,失败的 AI 短剧 80% 败在角色面部不一致。三种方案对比:
| 方案 | 一致性效果 | 难度 | 成本 |
|---|---|---|---|
| 纯 Prompt 描述 | ★★☆ 约 40% 帧间一致 | 低 | 免费 |
| 参考图(图生视频) | ★★★★ 约 75% 一致 | 低 | 积分 |
| Lora 训练 | ★★★★★ 约 90%+ 一致 | 高 | ¥30–100/次 |
方案一:纯 Prompt(入门测试用)
每次生成都带上相同的角色描述词:
[角色标准描述]:25岁中国女性,杏眼双眸,高鼻梁,樱桃唇,
黑色直发及腰,穿浅蓝色旗袍,气质清冷缺点:不同 batch 之间差异明显,适合单段视频,不适合多段连贯。
方案二:参考图锁定(推荐,日常使用)
1. 用 Midjourney / 即梦文生图生成角色正面参考图(清晰五官,无遮挡)
2. 上传参考图到可灵/海螺,选"图生视频"
3. 每次生成新场景都上传同一张参考图
4. 海螺专属:
→ 点击 "角色一致性" 按钮(主界面右上角人形图标)
→ 上传 2-3 张同角色不同角度的图
→ 系统自动建立角色模型,后续生成自动一致踩坑提示:参考图要选正面、表情中性、光线均匀的,否则 AI 会过度学习特定表情/光线。
方案三:Lora 训练(追求高质量短剧)
工具选择:
- SeaArt(https://www.seaart.ai):国内可用,支持视频 Lora 训练
- 可图(Kolors):快手开源模型,支持 Lora 微调
训练步骤(以 SeaArt 为例):
1. 准备训练素材:
- 同一角色 20-30 张图
- 包括:正面/侧面/不同表情/不同光线/不同服装
- 分辨率:512×512 以上,背景干净
2. 上传到 SeaArt → 模型训练 → 角色 Lora
3. 训练时间:约 30-60 分钟
4. 费用:约 ¥20-50/次(根据平台定价)
5. 训练完成后,所有生成都载入该 Lora,一致性 90%+5. Prompt 库(15 个分镜模板)
复制即用,[] 内替换为你的角色描述。
镜头类型
# 特写(面部情绪)
"[角色描述],极近特写,眼神复杂,有泪光,背景虚化,电影感,慢镜头"
# 近景(上半身+动作)
"[角色描述],近景,缓慢转身,长发随风飘动,背景是古楼廊道,斜阳暖光"
# 中景(全身+场景)
"[角色描述],中景,独立于竹林间,手持长剑,剑尖垂地,风吹竹叶飞舞"
# 远景(环境+氛围)
"远景,[角色描述],站在山顶,背对镜头,俯瞰云海,大气磅礴,鸟鸣"运镜方式
# 推镜(逼近感,适合高潮时刻)
"镜头由远及近缓慢推进,[角色描述],表情从平静转为坚定"
# 拉镜(空间感,适合告别场景)
"镜头缓慢后退,[角色描述],孤身立于原地,渐渐远去,哀而不伤"
# 旋转(震撼感,适合转折点)
"镜头绕[角色描述]旋转360度,武器光效闪烁,动感强烈,史诗配乐感"
# 平移跟随
"镜头平移跟随[角色描述]奔跑,街道两侧快速闪过,夜晚霓虹交替"场景类型
# 室内(现代)
"咖啡馆,午后阳光透过窗斜射,[角色描述],低头看书,尘埃在光中漂浮"
# 室内(古风)
"深夜书房,烛光摇曳,[角色描述],握笔沉思,墨迹未干,窗外雨声"
# 街道(都市)
"夜晚CBD,[角色描述],行走于人流中,高楼霓虹倒映,孤独感"
# 自然场景
"清晨山间,薄雾缭绕,[角色描述],打坐于松树下,鸟鸣泉水声"
# 科幻场景
"未来城市,悬浮列车穿梭,[角色描述],站在玻璃平台上眺望,全息广告闪烁"情绪类型
# 喜(克制式)
"[角色描述],嘴角微微上扬,眼底有光,但没有笑出声,侧脸,暖色调"
# 怒(压抑式)
"[角色描述],握拳,呼吸急促,眼神如刀,背后是乌云压城的天空"
# 哀(静默式)
"[角色描述],靠墙滑落坐下,双手捂脸,雨水顺着头发滴落,无声哭泣"
# 乐(自然式)
"[角色描述],在花田中奔跑,回头大笑,花瓣飞舞,暖光逆射"6. 实战案例:1 分钟古风女侠短剧
6.1 剧情大纲
女侠白鹿独自在山间苦练,因一次意外救下了与她有仇的将军之子,两人化干戈为玉帛。1 分钟,9 个分镜。
6.2 分镜 × Prompt × 工具 × 成本
| 分镜 | 内容 | Prompt(已优化) | 工具 | 耗时 | 积分 |
|---|---|---|---|---|---|
| 1 | 清晨苦练 | "古风女侠,黑发白衣,中景,竹林中挥剑,剑气横扫,清晨薄雾,镜头缓慢推近" | 可灵标准 | 3min | 10 |
| 2 | 发现陌生人 | "同一女侠,近景,停剑,目光警惕,向左看,竹林深处有动静,风声" | 海螺(角色一致性) | 4min | — |
| 3 | 受伤男子 | "清秀男子,古代劲装,摔倒在竹林地面,左肩有箭伤,意识模糊" | 可灵标准 | 3min | 10 |
| 4 | 女侠犹豫 | "女侠特写,眼神复杂,手握剑柄但未出鞘,内心挣扎,慢镜头" | 海螺 | 4min | — |
| 5 | 决定救人 | "女侠蹲下,拔箭,动作利落,男子痛苦皱眉,背景竹叶沙沙" | 可灵专业 | 6min | 35 |
| 6 | 草庐救治 | "简陋草庐内,女侠为男子包扎,烛光昏黄,沉默气氛" | 即梦 | 3min | 20 |
| 7 | 男子苏醒 | "男子睁眼,看到女侠,认出是仇人之女,表情从感激变为警戒" | 可灵标准 | 3min | 10 |
| 8 | 对峙 | "两人相对而立,女侠背对门口,男子手边有剑,对话,张力" | 海螺 | 4min | — |
| 9 | 化解 | "男子放下剑,女侠收剑入鞘,镜头拉远,两人在草庐门口,夕阳" | 可灵标准 | 3min | 10 |
总计:约 33 分钟生成时间,消耗约 75 积分(可灵专业版每日 660 积分,剩余充足)。
6.3 剪映成片完整步骤
1. 导入
剪映 → 新建项目 → 导入所有 9 段 AI 视频片段
→ 按分镜顺序拖入时间轴
2. 排序与修剪
→ 每段视频截取最好的 6-8 秒(去掉开头/结尾抖动帧)
→ 总时长控制在 55-65 秒
3. 转场
→ 分镜 1-4:使用"渐隐"转场(0.3s)
→ 分镜 5(高潮):使用"闪白"转场(0.2s)
→ 分镜 6-9:使用"溶解"转场(0.5s)
4. 配乐
→ 剪映素材库 → 搜索"古风 女侠" → 选纯音乐
→ 高潮处(分镜 5)对应音乐高潮点
→ 末尾淡出
5. 字幕
→ 时间轴下方 "智能字幕" → 朗读台词 → 自动识别
→ 或手动添加文字:字体选"思源宋体",颜色白色+黑色描边
6. 调色
→ 全选所有片段 → 统一调色:
- 色温:-10(偏冷清)
- 对比度:+15
- 饱和度:-5(降一点,古风感)
- 滤镜:搜索"浮世绘"或"水墨"(选透明度 30%)
7. 导出
→ 分辨率:1080P,帧率:24fps(电影感)
→ 码率:推荐 / 最高(视频较短,文件大小可控)
→ 导出时间:约 2-3 分钟6.4 总耗时与成本估算
| 环节 | 时间 | 费用 |
|---|---|---|
| 写剧本 + 分镜(Claude/DeepSeek) | 20 分钟 | ≈ ¥0.5 |
| 生成 9 段视频 | 33 分钟 | 75 积分(可灵专业版 ¥66/月内) |
| 剪辑合成 | 30 分钟 | ¥0(剪映免费) |
| 总计 | 约 1.5 小时 | ≈ ¥2–5 |
7. 审核合规与平台规范
7.1 抖音 AI 视频规范(2025 年)
- 必须标注:上传时勾选"含 AI 生成内容"(违规封号)
- 限流题材:涉及真实政治人物/历史事件的 AI 视频(即使明显是娱乐)
- 水印:平台会自动添加"AI 生成"角标,无法去除(2025 年规定)
- 版权声明:使用他人 IP 角色(漫威/迪士尼/国漫)需注意版权,不要直接商业化
7.2 B 站规范
- 投稿时选"AI 生成"标签,否则判为搬运
- AI 生成视频不计入"原创激励计划"(不能靠 AI 视频拿创作激励金)
- 但 AI 短剧可以收充电(打赏)
7.3 技术规范(平台要求)
| 参数 | 抖音 | B 站 | 微信视频号 |
|---|---|---|---|
| 最优分辨率 | 1080×1920(9:16 竖屏) | 1920×1080(横屏)/ 1080×1920 | 1080×1920 |
| 帧率 | 30fps | 24/30fps | 30fps |
| 最大文件 | 4GB | 8GB | 1GB |
| 推荐码率 | 8-15 Mbps | 6-16 Mbps | 6-8 Mbps |
8. 常见问题
Q: 角色嘴型和配音对不上?
A: 可灵/海螺生成时勾选"嘴型同步";或在剪映用"智能对齐"功能微调;台词短(每句 ≤ 10 字)嘴型对齐率更高。
Q: 生成的视频有明显 AI 痕迹(抖动、变形)?
A: 降低运动幅度,提示词加"稳定的镜头,轻微运动";可灵选"低运动幅度"。肢体动作(走路/打斗)最容易变形,优先用"上半身+固定镜头"。
Q: 多个场景光线风格不统一?
A: 每个提示词末尾加统一风格词,如"电影级光线,柔光,冷色调,暗调",剪映调色时再统一处理。
Q: 帧率不稳定,视频有卡顿感?
A: AI 生成视频默认 24fps,导入剪映后在"项目设置"里统一帧率为 24fps(不要混用 24/30fps)。
Q: 上传抖音后画质变差?
A: 抖音压缩较严重。导出时码率选"最高",并在发布时选"高清发布"(PC 端上传比手机端压缩少)。
9. 成本与效率参考
| 模式 | 时间成本 | 金钱成本 | 质量 |
|---|---|---|---|
| 全免费(可灵+剪映) | 4-6小时/条 | ¥0 | 中等 |
| 可灵专业版 + 海螺 | 2-3小时/条 | ¥100-200/月 | 较高 |
| Runway + 专业配音 | 3-4小时/条 | ¥300-500/月 | 最高 |
10. 延伸阅读
- 抖音切片上架橱窗 — 把做好的 AI 视频变成带货收入