商业落地 / 商业引擎｜数字人口播

商业引擎｜数字人口播

这不是主线版本，而是附属的数字人口播内容系统。它用剪映逆向根据文案生成数字人口播内容，覆盖 TTS、智能切片、ComfyUI 视频生成、FFmpeg 拼接、字幕样式和剪映草稿写入；无剪辑原始输出和有剪辑成片输出都能继续按脚本、音色、素材和模板无限并发复线。

回首页看流程图看证据

raw / 无剪辑原始输出

edited / 有剪辑成片输出

source repo

E:\xinde\szrttold

main app

`sc.py`：数字人模型工作台，覆盖音频上传、文本 TTS、视频生成、拼接和剪映草稿生成。

output

左侧展示无剪辑原始输出和有剪辑成片输出。它们来自同一条数字人链路，可按不同脚本、不同音色、不同素材无限并发复线。

流程图

商业引擎｜数字人口播流程图

文案进来，数字人口播视频和剪映草稿出去。

01｜输入Input

口播文案 / 数字人形象 / 音色 / 字幕样式

↓

02｜生成Process

TTS / 口型素材 / 字幕 / 画面片段

↓

03｜剪辑Process

时间线对齐 / 模板套用 / 剪映草稿

↓

04｜输出Output

批量口播视频 / 可编辑工程 / 多平台版本

流程快照

这个老系统做什么

定位

它是能力验证原型

验证短视频链路可以从音频、图像、视频、字幕一直走到剪映草稿。

Solved

解决的是跑通闭环

先不追求架构漂亮，重点是把外部服务、素材文件和剪辑工程真正串起来。

Keywords

关键词直接说出来

数字人模型、TTS、ComfyUI、FFmpeg、剪映草稿 JSON、字幕花字、贴纸和特效。

模块拆解

模块拆解要讲成一张工程图

这页呈现的不是“我会 Streamlit”，而是我能把数字人模型相关的模型服务、素材文件、时间线和剪辑软件格式对齐。

run command

python -m streamlit run sc.py

工作台入口

`sc.py` 管理服务器配置、工作模式、素材配置、视频模式、草稿配置和字幕样式。

音频系统

`audio_gen.py` 支持单条生成、批量生成和并发统计，输出到 `generated_audio`。

剪映草稿

`jianying_draft_auto_v10.py` 构建视频、音频、字幕、特效和关键帧素材。

视觉包装

`subtitle_style_config.py`、`sticker_manager.py`、`effect_manager.py` 管理花字、贴纸、视频特效。

运行证据

证据区要证明它真的跑过

页面保留样例成片、源仓库路径、输出目录和关键文件名。展示时可以把这页作为“批量口播能力”的证明，再切到生成引擎 V1讲工程化。

sample output

raw: videos/final_text_20260113_061105.mp4
edited: assets/szrttold-edited-sample.mp4

evidence list

videos / generated_audio / json / templatejson / templates / fonts / materials

takeaway

老系统的价值是先跑通“数字人模型闭环”：无剪辑原始输出可以自动生成，有剪辑成片也能继续模板化；同一套链路可以无限并发复线。

商业引擎｜数字人口播

商业引擎｜数字人口播流程图

这个老系统做什么

它是能力验证原型

解决的是跑通闭环

关键词直接说出来

核心流程是“文本/音频进来，视频和草稿出去”

输入模式

智能切片

音频生成

视频生成