TRPG-Replay-Generator
TRPG-Replay-Generator copied to clipboard
回声工坊:像编写文档一样简单地创作跑团replay视频
概述
回声工坊(TRPG-Replay-Generator)是一基于 python3 和 pygame 的,跨平台的自动replay视频制作工具,旨在替代replay视频和类视觉小说视频制作中的重复工作,以显著提升效率。本工具包括主程序、语音合成、导出为PR项目、导出为视频等四个模块;本程序通过脚本式编辑完成视频制作,在最大化效率的同时提供了较大的自定义空间;同时也提供了易用的图形化界面。无论是编程和文本处理的熟手,还是视频制作的新手,都可以轻松上手本程序。
程序下载
免安装版 95.4MB
- 免安装版是二进制可执行文件(.exe),仅适用于windows 64位系统。
-
解压即可使用,无需另外安装python环境及其依赖项目。
源代码 25.3MB
- 源代码是程序的源文件(.py),适用于 windows,linux和 macOS系统。
-
必须安装环境要求中指定的项目后才能运行。
配置要求:
最低:
- 显示器分辨率:1280x720
- 内存:4GB
最佳:
- 显示器分辨率:1920x1080
- 内存:8GB 或者更多
环境要求:
运行主程序replay_generator所必要的:
若要导出为Premiere Pro XML 文件,额外要求:
- Pillow >= 7.2.0
若要导出为 MP4 视频,额外要求:
- ffmpeg-python >= 0.2.0
- pydub >= 0.25.1
- 下载ffmpeg的可执行文件,并解压到本程序根目录。
若使用语音合成模块,额外要求:
- 安装阿里云智能语音服务Python SDK
- 获得阿里云AccessKey、AccessKey_Secret、Appkey
- azure-cognitiveservices-speech >= 1.21.0
- 获得Azure key
快速上手
1. 使用免安装版
- 下载可执行文件的压缩包,并解压;
- 运行
TRPG-Replay-Generator-v1.0.0.exe
打开图形界面;
- 在媒体定义栏输入
./toy/MediaObject.txt
,角色定义栏输入./toy/CharactorTable.tsv
,log文件栏输入./toy/LogFile.rgl
;
- 点击开始,即可开始放映示例项目;
- 进入程序后,按空格键(SPACE)开始播放;播放的过程中,按A键或左方向键跳转到前一小节,D键或右方向键跳转到后一小节,按空格暂停播放,按F5键或I键展示详细信息,按F11键或P键将画面缩放至50%,按ESC键终止播放并退出。
注意:可执行文件release无需另外安装python环境就可使用。
2. 使用源代码
- 下载源代码的压缩包,并解压;
- 确保python已经准确安装,然后在解压路径,使用终端运行下列命令,安装环境要求;
pip install -r ./requirements.txt
- 使用终端运行下列命令,即可开始放映示例项目;
python ./replay_generator.py -l ./toy/LogFile.rgl -d ./toy/MediaObject.txt -t ./toy/CharactorTable.tsv
- 进入程序后,按空格键(SPACE)开始播放;播放的过程中,按A键或左方向键跳转到前一小节,D键或右方向键跳转到后一小节,按空格暂停播放,按F5键或I键展示详细信息,按F11键或P键将画面缩放至50%,按ESC键终止播放并退出。
参考文档(文档版本 alpha 1.12.6)
输入文件格式
本程序的工程由三个文本文件构成:媒体定义文件、角色配置文件、log文件。作为输入文件的所有文本文件,均需要使用 utf-8
编码。
1. 媒体定义文件
媒体定义文件定义了工程中所需要使用的媒体对象,作为整个工程调用的资源;媒体定义文件使用类似python类实例化的语法。
目前版本中,可用的对象包括下列:
- 文本、描边文本 Text、StrokeText
Text(fontfile='./media/SourceHanSansCN-Regular.otf',fontsize=40,color=(0,0,0,255),line_limit=20,label_color='Lavender')
StrokeText(fontfile='./media/SourceHanSansCN-Regular.otf',fontsize=40,color=(0,0,0,255),line_limit=20,edge_color=(255,255,255,255),label_color='Lavender')
- 文本是气泡对象的一部分,无法单独使用;
-
fontfile
可选参数,指定一个字体文件的路径;默认参数是 思源黑体-regular; -
fontsize
可选参数,设置字体的字号,合理的参数是大于0的整数;默认为40; -
color
可选参数,设置字体的颜色,是一个4元素的元组,对应(R,G,B,A),四个元素应为0-255的整数;默认值是黑色; -
line_limit
可选参数,设置单行显示的字符数量上限,超过上限会触发自动换行;默认为20字; -
edge_color
可选参数,设置字体的描边颜色,仅描边文本可用,是一个4元素的元组,对应(R,G,B,A),四个元素应为0-255的整数;默认值是白色。 -
label_color
可选参数,设置字体内容在PR中显示的标签颜色,参考可用颜色列表;默认值是淡紫色。
注意:由于气泡对象需要引用文本对象,因此,文本对象在媒体定义文件中的位置必须在气泡对象的定义之前!。
- 气泡 Bubble
Bubble(filepath=None,Main_Text=Text(),Header_Text=None,pos=(0,0),mt_pos=(0,0),ht_pos=(0,0),align='left',line_distance=1.5,label_color='Lavender')
- 气泡是一个文本框,在角色发言时显示,包含了主文本、头文本、底图三个组成部分。
-
filepath
可选参数,指定一个图片文件的路径;或者指定为None,表示不需要底图;默认值为None; -
Main_Text
可选参数,为主文本指定一个Text
或者StrokeText
类的变量;主文本对应 log文件 中的 发言文本;默认值是默认参数的Text对象,不可以设置为None; -
Header_Text
可选参数,为头文本指定一个Text
或者StrokeText
类的变量;头文本对应发言者的角色名;默认为None,既无头文本; -
pos
可选参数,设置气泡在屏幕上的位置,是一个2元素的元组,对应 (X,Y);默认为 (0,0),即左上角; -
mt_pos
可选参数,设置主文本相对于气泡底图的位置,是一个2元素的元组,对应 (X,Y);默认为 (0,0),即左上角; -
ht_pos
可选参数,设置头文本相对于气泡底图的位置,是一个2元素的元组,对应 (X,Y);默认为 (0,0),即左上角; -
align
可选参数,设置主文本的对齐模式,可选项有"left"
、"center"
,分别对应左侧对齐和居中对齐;默认为左侧对齐; -
line_distance
可选参数,设置了多行显示时的行距,默认值为1.5倍行距。 -
label_color
可选参数,设置气泡底图在PR中显示的标签颜色,参考可用颜色列表;默认值是淡紫色。
- 背景 Background
Background(filepath,pos=(0,0),label_color='Lavender')
- 背景指整个屏幕的背景,通常位于最下的图层,可以在 log文件 中的 背景行 中设置背景及其切换效果;
-
filepath
必要参数,指定一个图片文件的路径;或者指定为{'black','white','greenscreen'}
中的一个,以建立纯色背景; -
pos
可选参数,指定了背景在屏幕上的位置,是一个2元素的元组,对应(X,Y),默认为(0,0),即左上角。 -
label_color
可选参数,设置背景图在PR中显示的标签颜色,参考可用颜色列表;默认值是淡紫色。
注意:由于背景图通常都是全屏的图片,因此不建议修改
Background
的pos的默认值。
- 立绘 Animation
Animation(filepath,pos=(0,0),tick=1,loop=True,label_color='Lavender')
- 立绘指和角色绑定的个人形象图片或动画,通常位于背景的上层,气泡的下层。
-
filepath
必要参数,指定一个图片文件的路径;或通过通配符指定一系列顺序命名的图片文件的路径,以设置为动态立绘。 -
pos
可选参数,指定了立绘在屏幕上的位置,是一个2元素的元组,对应(X,Y),默认为(0,0),即左上角。 -
tick
可选参数,仅在动态立绘中生效,设置立绘动画的拍率,单位为 帧/拍;默认为1,即一拍一。 -
loop
可选参数,仅在动态立绘中生效,设置立绘动画是否循环播放,可以是True
或者False
,设置为否时,当动态立绘的完整播放了一次之后,会停留在最后帧;默认是True
,即循环播放。 -
label_color
可选参数,设置立绘图在PR中显示的标签颜色,参考可用颜色列表;默认值是淡紫色。
注意:一个角色可以在不同的subtype下指定不同的立绘,用于实现差分效果;使用时在log文件的对话行里指定到不同的subtype。
注意:如果希望实现多人同框效果,建议为同框时的立绘另外建立
Animation
对象,并在定义时指定合适的位置。注意:在路径中使用符号
*
代表匹配任意字符;建议以位数相同的数字命名动态立绘。例如test_000.png、test_001.png。
- 背景音乐 BGM
BGM(filepath,volume=100,loop=True,label_color='Caribbean')
- 背景音乐指长的,一直位于后台循环播放的音频;支持的格式是
.ogg
,如果是其他格式的背景音乐,建议先进行格式转换。 -
filepath
必要参数,指定一个音频文件的路径。 -
volume
可选参数,设置背景音乐的音量,合理的参数是0-100的整数;默认为100; -
loop
可选参数,设置背景音乐是否会循环播放;默认为循环播放;如果需要不循环,设置为False
; -
label_color
无效参数,背景音乐并不会导入到PR项目;默认值是加勒比海蓝色。
注意:BGM建议使用.ogg格式的音频,否则有可能出现程序的不稳定。另外,建议在后期制作软件中手动加入BGM。
注意:BGM和audio的逻辑不同,不可混用!
- 音效 Audio
Audio(filepath,label_color='Caribbean')
- 音效指短音频,音效通常只会完整地播放一次;支持的格式是
.wav
,如果是其他格式的音效,建议先进行格式转换。 -
filepath
必要参数,指定一个音频文件的路径。 -
label_color
可选参数,设置音频音效在PR中显示的标签颜色,参考可用颜色列表;默认值是加勒比海蓝色。
注意:本文提及的 文件路径 的格式均为字符串,即需要引号引起来。例子:
"./pic/zhang.png"
注意:定义的媒体变量名需要符合python变量名标准,且不可以使用程序代码中已占用的变量名(详见已占用变量名)。
注意:replay视频中通常包含大量的语音文件,不建议全建立
Audio
对象,会消耗较大的内存;在Log文件的 对话行 的 音效框 里指定文件路径即可。注意:通过文件路径指定的音频,在PR项目中标签颜色是加勒比海蓝色,且将占用
语音轨道(Voice)
而非音效轨道(SE)
媒体定义文件例子:
参考示例媒体定义文件
2. 角色配置文件
角色配置文件指明了各个角色和各项媒体资源之间的对应关系。
角色配置文件是一个制表符'\t'
分隔的文本数据表文件,或者.xlsx
格式的Excel电子表格;用于配置角色和 立绘、气泡、声音 等媒体对象的对应关系;用于replay_generator主程序的角色配置文件需要至少包括 Name、Subtype、Animation、Bubble
四列;用于speech_synthesizer程序的角色配置文件需要至少包括 Name、Subtype、Voice
三列,SpeechRate、PitchRate
两列是可选的。
- Name列,角色的名称,和 Log文件-对话行-角色框 内的名称相互对应;名称可以包含英文字符,空格,数字,下划线,中文,不可以包含任何其他字符。
- Subtype列,角色的差分名称;差分名称可以包含英文字符,数字,下划线,中文,不可以包含空格;每个Name必须要有一个Subtype是default,且同一个角色不可以有重复的Subtype。
- Animation列,角色立绘对象;需要是 媒体定义文件 中已经定义的
Animation
类的变量名,或者使用 NA 表示缺省。 - Bubble列,发言气泡对象;需要是 媒体定义文件 中已定义的
Bubble
类的变量名,或者使用 NA 表示缺省。 - Voice列,角色配音的音源名;所有可选的Voice详见阿里云可用语音和Azure可用语音;不需要语音的角色使用 NA 表示缺省。
- SpeechRate列,角色配音的语速;取值范围是(-500,500),对应0.5倍速至2倍速。
- PitchRate列,角色配音的语调;取值范围是(-500,500),对应低八度至高八度。详见接口说明
角色配置文件例子:
Name | Subtype | Animation | Bubble | Voice | SpeechRate | PitchRate |
---|---|---|---|---|---|---|
张安翔 | default | zhang | bubble1 | sicheng | 50 | 0 |
张安翔 | scared | zhang_scared | bubble1 | sicheng | 30 | 0 |
KP | default | drink | bubble2 | Azure::zh-CN-XiaomoNeural | 50 | 0 |
旁白 | default | NA | bubble2 | NA | NA | NA |
注意:角色配置表中所谓“角色”,不仅包括狭义的玩家,NPC等;同时也可以包括旁白、骰子、图例等广义的“角色”。
注意:缺失
Bubble
的角色不可以作为发言行的主发言人。注意:指定Azure音源给角色时,需要在音源名前添加
Azure::
标注。
3. Log文件(RplGenLog)
log文件是整个演示的剧本文件,决定了演示的内容和效果;
log文件有4类有效行,对话行,背景行,设置行和内建动画行,分别有其对应的格式。
log文件中每个行是均是一个独立的单元,文本内容不能跨行。
RplGenLog格式的相关辅助工具见Log文件格式辅助工具
A. 对话行
[name1(100).default,name2(60).default,name3(60).default]<replace=0>:Talk#Text.<all=0>{"./audio/1.ogg";30}{Audio;*30}
通过对话行,在演示中展示角色的 立绘 ,并用相应的 气泡 显示 发言文本 中的文字。其中的对应关系在 角色配置文件 中定义。
-
角色框:
[name(alpha).subtype;...]
- 角色框内最多指定 3 个角色,同框角色的立绘都将展示出来,但只有顺位第一个角色被视为当前句子的发言人,Bubble和Voice以顺位第一个角色的为准;
- 只有顺位第一个角色的立绘的默认透明度为100,其余角色的透明度将使用
secondary_alpha
的值;在角色名后添加(alpha)
可以手动指定立绘的透明度; - 同一个角色如果有差分,可以在角色名后使用
.subtype
来指定差分;未指定差分的角色的将使用.default
这一默认差分。
-
切换效果修饰符:
<method=time>
- 目前所有可用的切换效果
method
参考 动态切换效果 小节;对话行中指定的切换效果,将同时应用于立绘和气泡; - 若对话行中未指定切换效果,则立绘的切换效果使用 am_method_default,气泡的切换效果时使用 bb_method_default;
- 切换时长
time
指渐变持续的帧数;可以缺省持续时长,此时立绘的切换时长将使用 am_dur_default ,气泡的切换时长将使用 bb_dur_default;
- 目前所有可用的切换效果
-
发言文本:
^Talk#Text
- 发言文本可以是大部分文本,但不能包括英文双引号
""
和反斜杠\
;不建议包括英文方括号[]
、英文尖括号<>
和英文花括号{}
,否则可能导致程序的不稳定或报错; - 发言文本中使用井号
#
作为手动换行符,或在句首使用^
声明手动换行模式;在手动指定换行符的对话行内,自动换行是失效。
- 发言文本可以是大部分文本,但不能包括英文双引号
-
文本效果修饰符:
<method=time>
- 目前可用的文本展示的效果
method
有all,w2w,l2l
:
-
all
,一次性展示所有文本,time
此时指显示文本前延迟帧数; -
w2w
,逐字展示文本; -
l2l
,逐行展示文本。
- 若语句中未指定展示效果,则文本效果使用 tx_method_default;
- 单位时间
time
指每显示一个字需要的帧数;可以缺省单位时间,此时单位时间将使用 tx_dur_default;
- 目前可用的文本展示的效果
-
音效框:
{file_or_obj;*time}
- 音效
file_or_obj
可以指定一个Audio对象,或者一个文件的路径,或者使用NA表示缺省; - 延迟时间
time
指这个音效相对于本小节第一帧所延迟的帧数; - 一个对话行可以有多个音效框;
- 若在音效框的time数值前添加星号
*
,则这个音效为星标音频。本小节的总时长由星标时间指定,总时长 = time + asterisk_pause。
- 音效
注意:在使用
#
进行手动换行的句子里,如果第一行长度超过line_limit,在<w2w>
模式仍会自动换行,直到第一个#
被触发为止。为了避免这种情况的发生,在句首声明^
。注意:当文本展示效果为
<all>
时,单位时间指显示的延迟帧数。注意:星标音频的时间单位是秒,而非帧;星标的音效通常由 speech_synthesizer.py 自动生成。请谨慎地手动设置星标音效。
注意:一个对话行只能指定一个星标音频。
对话行例子:
[张安翔]:最基本的对话行
[张安翔]<black>:指定了切换方式
[张安翔]<black=30>:指定了切换时间
[张安翔]<black=30>:指定了文字显示模式<w2w>
[张安翔]<black=30>:指定了文字显示单位时间<w2w=5>
[张安翔,KP]<black=30>:设置了多人同框<w2w=5>
[张安翔(60),KP(30)]<black=30>:手动设置了立绘透明度<w2w=5>
[张安翔(60).scared,KP(30)]<black=30>:显示角色的差分立绘<w2w=5>
[张安翔(60).scared,KP(30)]<black=30>:设置手动换行模式#以井号作为换行符#逐行显示内容<l2l=5>
[张安翔(60).scared,KP(30)]<black=30>:播放语音<all=5>{'./voice/1.ogg'}
[张安翔(60).scared,KP(30)]<black=30>:播放音效<all=5>{SE1;*30}
B. 背景行
<background><replace=0>:Background
在背景行中指定一个 Background
类的媒体对象,以切换播放的背景图片。
-
背景行的识别标志:
<background>
是背景行的必要组成部分。 -
切换效果修饰符:
<method=time>
可用的背景切换效果method
包括:-
cross
:交叉溶解,新的背景会逐渐覆盖原背景,参数是整个渐变的时长 -
black
:黑场,原背景先隐入黑场,然后新背景再逐渐出现,参数是整个渐变的时长。 -
white
:白场,原背景先隐入白场,然后新背景再逐渐出现,参数是整个渐变的时长。 -
replace
:替换,瞬间替换,参数是替换发生后的停顿时间。默认值是replace=0。 -
delay
:延时,延后替换,参数是替换发生前的延迟时间。 -
push
:推,新立绘从右侧进入画面,将旧立绘推出画面,参数是整个动画的持续时间。 -
cover
:覆盖,新立绘从右侧进入画面,覆盖在旧立绘上层,参数是整个动画的持续时间。
-
- 若语句中未指定切换效果,切换效果使用 bg_method_default;
- 可以缺省持续时长,此时切换时长使用 bg_dur_default;
-
black
和white
这两个背景,无需定义可直接在背景行中使用。
背景行例子:
<background>:BG1
<background><cover>:BG2
<background><black=30>:BG3
C. 设置行
<set:am_method_default>:<replace=0>
通过设置行,动态地修改全局变量; set:后跟需要设置的全局变量名; 可以通过set动态修改的全局变量有:
-
am_method_default
:立绘的默认切换方法,初始值是:<replace=0>
。- 当对话行中缺省 切换效果修饰符 时,则使用该默认值;
- 可用的选项参考 动态切换效果。
-
am_dur_default
:默认切换时间,初始值是:10,单位是帧。- 当对话行的 切换效果修饰符 中未指定时间,则使用该默认值;
- 例如
<replace>
,等价于<replace=10>
-
bb_method_default
:气泡的默认切换方法,初始值是:<replace=0>
。- 当对话行中缺省 切换效果修饰符 时,则使用该默认值;
- 可用的选项参考 动态切换效果。
-
bb_dur_default
:默认切换时间,初始值是:10,单位是帧。- 当对话行的 切换效果修饰符 中未指定时间,则使用该默认值;
- 例如
<replace>
,等价于<replace=10>
-
bg_method_default
:默认展示方法,初始值是:<replace=0>
。- 当背景行中缺省 切换效果修饰符 时,则使用该默认值;
- 可用的选项有
cross、black、white、replace、delay、push、cover
。
-
bg_dur_default
:默认展示时间,初始值是:10,单位是帧。- 当背景行的 切换效果修饰符 中未指定时间,则使用该默认值
- 例如
<replace>
,等价于<replace=10>
-
tx_method_default
:默认文本展示方法,初始值是:<all=1>
。- 当对话行中缺省 文本效果修饰符 时,使用该默认值
- 可用的选项有
all、w2w、l2l
; - 例如
[name]:talk
,等价于[name]<replace=0>:talk<all=1>
-
tx_dur_default
:默认文本展示时间,初始值是:5,单位是帧。- 当对话行的
<文本效果修饰符>
中未指定时间,则使用该默认值; - 例如
<l2l>
,等价于<l2l=5>
。
- 当对话行的
-
speech_speed
:语速,初始值是:220,单位是 words/min。- 当对话行中没有指定星标音频的时候,语速将影响该小节的总时长,总时长 = 发言文本长度 / speech_speed。
-
asterisk_pause
:星标音频的间隔时间,初始值是:20,单位是帧。- asterisk_pause 仅能通过 设置行 进行设置,会应用于之后所有的星标音频。
-
secondary_alpha
:次要立绘的透明度,初始值是:60,单位是百分之。- 当对话行的角色框里未给角色指定透明度,则除了第一立绘以外,剩余角色立绘使用该默认值作为透明度。
-
BGM
:背景音乐- 使用
<set:BGM>
设置或切换背景音乐,需要指定一个BGM对象,或一个.ogg
格式的音频文件的路径; -
<set:BGM>:stop
可以终止背景音乐的播放。 - 设置了背景音乐后,将在下一个 对话行 或 内建动画行 的第一帧生效。
- 连续指定了多个BGM时,在后续的每个句子,将依照指定顺序逐个生效,直到清空队列为止。
- 使用
-
formula
:切换效果的曲线函数,初始值是:linear,即线性。- 目前可用的formula包括
linear(线性)、quadratic(二次)、quadraticR(二次反向)、sigmoid(S型)、sincurve(正弦)、left(左锋)和right(右峰)
; - formula可以接受 lambda函数 形式定义的自定义函数;自定义函数需要以
(begin,end,duration)
为参数,且值域在[0,1]
之间; - formula仅能通过 设置行 进行设置,会应用于之后所有的切换效果。
- 目前可用的formula包括
注意:使用非.ogg文件作为背景音乐,可能导致程序的不稳定,或者卡死!
设置行例子:
<set:bg_method_default>:<black=30>
<set:tx_dur_default>:10
<set:BGM>:'./BGM/test.ogg'
<set:BGM>:BGM1
<set:formula>:sigmoid
<set:formula>:lambda begin,end,duration:np.linspace(end,begin,duration)
D. 内建动画行
<hitpoint>:(张安翔,10,7,4)
<dice>:(describe,100,50,36),(describe,20,NA,14)
目前支持的内建动画包括生命值损失、恢复动画,滚动式骰子动画。
a. 生命值 :(name,max,begin,end)
- 使用生命值动画的标志:
<hitpoint>:
- 括号内的参数,按顺序分别是:显示的文字,总生命值,变化前的生命值,变化后的生命值;
- 生命值动画仅可输入一组参数。
b. 骰子 :(describe,dice,check,face),...
- 使用骰子动画的标志:
<dice>:
- 括号内的参数,按顺序分别是:骰子描述,骰子的面数,检定值,出目;
- 当指定检定值之后,当出目小于等于检定值,大于检定值,小于等于骰子面数的5%,大于骰子面数的95%,将分别被着色为蓝色,橙色,绿色,红色;
- 检定值可使用NA表示缺省。当检定值缺省时,出目将着色为白色。
- 骰子动画最多可输入四组参数,组与组之间可使用逗号分隔。指定超过4组参数,则仅保留前4组参数。
注意:在导出的PR项目中,内建动画的标签颜色是芒果黄色。
E. 注释行、空白行
#annotation
- 当一个行的第一个字符是井号
#
,则这个行被认作为注释,行内的任何内容都不会被执行; - log文件可以任意地添加空白行,且不会影响程序的正常使用。
4. 动态切换效果
在alpha 1.7.0版本之后,添加了大量了适用于立绘和气泡的动态切换效果,可用轻松的构建灵动的画面和各具功能性的气泡;
在对话行中的切换效果修饰符中可用设置切换效果,或者通过 am_method_default、bb_method_default
设置全局的切换效果;
一个合法的method需要包含下列5类关键字中的至少一个,多个关键字之间使用下划线 _
连接:
-
replace, delay, black
: 透明度变化,分别对应:瞬间出现(默认值),延后出现,淡入淡出; -
static, leap, pass, circular
: 切换动态,分别对应:静止(默认值),跳起,通过,圆周运动(实验功能); -
up, down, left, right, DG[int]
:切入角度,分别对应:上(默认值),下,左,右,指定角度(12点方向的逆时针角度); -
major, minor, entire, [int]
:运动尺度,分别对应:长距离(默认值),短距离,全屏水平,指定长度(像素); -
both, in, out
:效果应用于,分别对应:双端(默认值),仅切入,仅切出。
注意:当同一类关键字出现了多次时,将以最后一次为准;未出现的关键字类型则采用默认值。
切换效果例子:
<black_pass=30>
<replace=20>
<black_leap_minor_DG30=10>
<delay_right_circular_major=10>
<in_black_pass_up_major=30>
主程序replay_generator.py
主程序的参数:
-
--LogFile, -l :必要参数,log文件的路径,文件格式要求详见 输入文件格式.log文件;
-
--MediaObjDefine, -d :必要参数,媒体定义文件的路径,文件格式要求参考 输入文件格式.媒体定义文件;
-
--CharacterTable, -t :必要参数,角色表文件的路径,格式为制表符分隔的数据表,或者Excel电子表格,包含至少
Name、Subtype、Animation、Bubble
4列; -
--OutputPath, -o :可选参数,输出文件的目录;如果输入了该标志,则项目的时间轴、断点文件、内建对象文件将输出到指定的目录,格式分别为timeline、breakpoint、bulitinmedia。如果指定了其他输出标志,相应的文件也将输出到指定的目录。
-
--FramePerSecond, -F :可选参数,播放的帧率,单位是fps;默认值是30fps;
-
--Width, -W :可选参数,窗体的宽;默认值是1920;
-
--Height, -H :可选参数,窗体的高;默认值是1080;
-
--Zorder, -Z :可选参数,渲染的图层顺序;通常不建议修改这个参数,除非必要。格式要求详见 进阶使用.图层顺序。
-
--AccessKey, -K :可选参数,阿里云账号的AccessKey ID,使用阿里云音源执行语音合成时所需要的;
-
--AccessKeySecret, -S :可选参数,阿里云账号的AccessKeySecret 密钥,使用阿里云音源执行语音合成时所需要的;
-
--Appkey, -A :可选参数,阿里云语音合成应用的Appkey,使用阿里云音源执行语音合成时所需要的;
-
--Azurekey, -U:可选参数,微软Azure认知语音服务的Key,使用Azure音源执行语音合成时所需要的;
-
--ServRegion, -R:可选参数,微软Azure认知语音服务的服务地区,使用Azure音源执行语音合成时所需要的;默认是东亚地区;
-
--Quality, -Q :可选参数,导出为mp4视频时的质量,即ffmpeg程序的crf值;取值范围为0-51,越小对应越高的视频质量,通常合理范围为18-28;默认值是24
-
--ExportXML :可选标志,如果使用该标志,会输出一个能导入到PR的XML文件,以及其引用的一系列PNG图片到输出目录。
-
--ExportVideo :可选标志,如果使用该标志,会导出一个和窗口中播放的内容完全一致的MP4视频。使用该标志则会跳过窗口播放。
-
--SynthesisAnyway :可选标志,如果使用该标志,会对log文件中尚未处理的星标行进行语音合成;一系列WAV音频到会输出到输出目录。
-
--FixScreenZoom :可选参数,仅在windows系统上生效。使用该标志以消除由于windows系统缩放倍率,而导致的窗体尺寸异常。
--Zorder 图层顺序
- 修改图层顺序参数,可以改变各个图层的重叠关系。
- 默认的图层顺序为
-Z "BG3,BG2,BG1,Am3,Am2,Am1,Bb"
,顺序为从下到上,即背景在最下层,气泡在最上层,立绘在中间,其中主立绘在其他立绘上层。 - 主要的修改需求可能是要求立绘覆盖在气泡的上层,因此,可以将 --Zorder 参数设置为
"-Z BG3,BG2,BG1,Bb,Am3,Am2,Am1"
注意:不建议修改3个BG图层的顺序,否则会导致多个切换效果的不正常表现!
主程序命令例子:
python replay_generator.py \
-l LogFile.txt \
-d MediaDefine.txt \
-t CharactorTable.csv \
-F 30 -W 1920 -H 1080 \
--ExportVideo --FixScreenZoom
语音合成模块 speech_synthesizer.py
语音合成模块的参数
- --LogFile, -l :必要参数,log文件的路径,文件格式要求详见 输入文件格式.log文件;
- --MediaObjDefine, -d :必要参数,媒体定义文件的路径,文件格式要求参考 输入文件格式.媒体定义文件;
-
--CharacterTable, -t :必要参数,角色表文件的路径,格式为制表符分隔的数据表,或者Excel电子表格,包含至少
Name、Subtype、Voice
3列; - --OutputPath, -o :必要参数,输出目录,合成的音频和处理后的log文件将会输出到这个路径。
- --AccessKey, -K :可选参数,阿里云账号的AccessKey ID,使用阿里云音源执行语音合成时所需要的;
- --AccessKeySecret, -S :可选参数,阿里云账号的AccessKeySecret 密钥,使用阿里云音源执行语音合成时所需要的;
- --Appkey, -A :可选参数,阿里云语音合成应用的Appkey,使用阿里云音源执行语音合成时所需要的;
- --Azurekey, -U:可选参数,微软Azure认知语音服务的Key,使用Azure音源执行语音合成时所需要的;
- --ServRegion, -R:可选参数,微软Azure认知语音服务的服务地区,使用Azure音源执行语音合成时所需要的;默认是东亚地区;
- --PreviewOnly:可选标志,如果使用该标志,会忽略掉所有输入文件,仅打开一个用于试听的图形界面;
- --Init:可选参数,试听界面的初始语音服务;默认是阿里云。
语音合成模块命令例子:
python speech_synthesizer.py \
-l LogFile.txt \
-d MediaDefine.txt \
-t CharactorTable.csv \
-K *** -S *** -A *** -U *** -R eastasia \
-o ./test_output
1. 获取阿里云智能语音交互key
- 注册并登录阿里云智能语音服务控制台
- 进入
服务开通及购买
,按照自己的需要配置服务。 - 进入项目管理页面,创建项目,选择
仅语音合成
,设置项目名称,即可获取项目Appkey - 鼠标移动至右上角头像,进入下拉菜单,进入AccessKey管理
- 点击创建AccessKey,即可获取AccessKey和AccessKeySecret
- AccessKeySecret仅在创建时可见,务必记录;AccessKey和AccessKeySecret拥有账户的所有权限,请务必妥善保管,以免遭受意外损失!
2. 获取Azure认知语音服务key
- 进入认知语音服务,免费开始并注册登录。
- 注册登录完毕后,进入Azure控制台门户,并创建一项语音服务。
- 选择订阅
免费试用
,并新建一个自定名称的资源组。 - 选择就近的服务区域,并取一个自定的名称,定价层选择
Free F0
,剩余项目可用默认,创建服务。 - 进入所新建的服务,点击管理密钥,即可获取并复制服务密钥,以及服务区域。请务必妥善保管,以免遭受意外损失!
3. 用于语音合成的星标格式
待语音合成的log文件中,在 对话行的音效框 使用 待处理星标 表明需要执行语音合成;当主程序遭遇 待处理星标 时,会报出下列报错,并终止程序。
[ParserError]: Unprocessed asterisk time label appeared in dialogue line *. Add --SynthesisAnyway may help.
语音合成模块可以处理log文件中 待处理星标 ,并将处理完毕的log文件以 AsteriskMarkedLogFile.rgl
为文件名,输出在指定的输出路径。
在运行 replay_generator.py
时指定标志 --SynthesisAnyway
,即可在执行主程序之前,先执行语音合成并处理妥当log文件中的待处理星标。
待处理星标的格式
-
{*}
:待语音合成的标志,将本对话行的全部发言文本执行语音合成; -
{*speech_text}
:合成指定文本的语音的标志;指定文本只能包含,。:?!“”
等中文符号; -
{"./media/voice.wav";*}
:当需要使用外部音频,而非语音合成时,可以读取音频文件持续时间,并填补到星标之后;这可以使小节的时长和音频时长同步。
待处理log文件例子:
[张安翔]:阿里云语音合成。{*}
[张安翔]:指定语音合成内容。{*将这一段文字合成为语音}
[张安翔]:使用现成的音频文件。{'./media/voice.wav';*}
注意:若语音合成未成功,会自动重试至多五次;五次重试后仍未成功则会终止语音合成程序。
注意:若角色配置表中,某角色缺省Voice,或者Voice不为可用的音源,则会略过这个角色的待处理星标。
注意:通过 “先执行语音合成--SynthesisAnyway” 调用语音合成模块,会使异常排查变得更加困难,不推荐初学者这样使用。
注意:如果在语音合成过程中,由于网络等问题导致合成中断,已合成的星标将被替换,未合成的星标将被保留。将此时输出的
AsteriskMarkedLogFile.rgl
重新输入语音合成程序,即可从上一次断点继续合成。
4. 语音合成试听
为了方便调整语音参数和试听,语音合成模块提供了一个有图形界面的试听窗口,可以用于预览大部分可用的音源。提供给功能包括下列:
- 复制按钮,用于复制当前语音参数,可直接黏贴到 角色配置文件 中使用。
- 播放按钮,基于当前参数和文本,合成并播放语音。
- 保存按钮,基于当前参数和文本,将合成的音频保存到本地文件。
使用
python speech_synthesizer.py -K *** -S *** -A *** -U *** -R eastasia --PreviewOnly
注意:必须要填写key后才能正常使用试听,试听同样会占用语音服务额度。
导出PRXML模块 export_xml.py
导出PRXML模块的参数:
- --TimeLine, -l :必要参数,timeline文件的路径,timeline文件是由主程序生成在输出路径的工程文件;
- --MediaObjDefine, -d :必要参数,媒体定义文件的路径,文件格式要求参考 输入文件格式.媒体定义文件;
- --CharacterTable, -t : 无效参数,导出PRXML模块,导出视频模块不需要角色配置表;
- --OutputPath, -o :必要参数,输出文件的目录,媒体的图片和XML项目将输出到这个路径。
- --FramePerSecond, -F :可选参数,播放的帧率,单位是fps;默认值是30fps;
- --Width, -W :可选参数,窗体的宽;默认值是1920;
- --Height, -H :可选参数,窗体的高;默认值是1080;
- --Zorder, -Z :可选参数,渲染的图层顺序;通常不建议修改这个参数,除非必要。格式要求详见 进阶使用.图层顺序。
导出PRXML模块命令例子:
python export_xml.py -l 12345.timeline -d MediaDefine.txt -o ./test_output
导出PRXML模块的注意事项
- 单独使用导出PRXML模块时,FramePerSecond、Width、Height、Zorder等参数,建议和主程序生成timeline文件时使用的参数相一致,以免出现不稳定的表现。
- 发言文本,内建动画等将以png图片的格式输出到指定的输出目录,文件的量可能较大,建议指定一个空白文件夹为输出目录。
- 导出的XML项目将和输入的timeline文件同名。
导出视频模块 export_video.py
导出视频模块参数
- --TimeLine, -l :必要参数,timeline文件的路径,timeline文件是由主程序生成在输出路径的工程文件;
- --MediaObjDefine, -d :必要参数,媒体定义文件的路径,文件格式要求参考 输入文件格式.媒体定义文件;
- --CharacterTable, -t : 无效参数,导出PRXML模块,导出视频模块不需要角色配置表;
- --OutputPath, -o :必要参数,输出文件的目录,媒体的图片和XML项目将输出到这个路径。
- --FramePerSecond, -F :可选参数,播放的帧率,单位是fps;默认值是30fps;
- --Width, -W :可选参数,窗体的宽;默认值是1920;
- --Height, -H :可选参数,窗体的高;默认值是1080;
- --Zorder, -Z :可选参数,渲染的图层顺序;通常不建议修改这个参数,除非必要。格式要求详见 进阶使用.图层顺序。
- --Quality, -Q :可选参数,导出为mp4视频时的质量,即ffmpeg程序的crf值;取值范围为0-51,越小对应越高的视频质量,通常合理范围为18-28;默认值是24
导出视频模块命令例子:
python export_video.py -l 12345.timeline -d MediaDefine.txt -Q 21
导出视频模块的注意事项
- 单独使用导出PRXML模块时,FramePerSecond、Width、Height、Zorder等参数,建议和主程序生成timeline文件时使用的参数相一致,以免出现视频和预览不一致的情况。
- 项目导出为视频时,如果包含较多的动态帧,例如动态切换效果,动画立绘,内建动画效果等,可能会减慢导出速度。通常而言,平均导出速度不低于30fps。
- 使用
--Quality
指定导出视频质量时,通常18即代表极好的视频质量;Quality指定过小的值会导致输出文件巨大! - 导出的mp4视频和mp3音频和输入的timeline文件同名。
- 需要将ffmpeg的两个可执行文件 ffmepg.exe、ffprob.exe 和 export_video.py 置于同一个路径下,或者放置在环境变量的路径下。
- 导出视频模块需要较大的内存(RAM),请确保电脑硬件满足程序的最低配置需要。
图形界面 gui.py
出于易用性的考虑,使用图形界面将上述四个功能模块包装。
使用
python gui.py
Log文件格式辅助工具
1. Visual Studio Code RplGenLog 语法拓展
由憧憬少老师提供了在 Visual Studio Code 中使用的RplGenLog语法拓展。
该插件提供了以下功能:
- Log文件的语法高亮;
- 指令片段的自动补全;
- 代码折叠和嵌套折叠;
- 角色、对话、背景的数量统计;
安装方法:
- 在vscode拓展商店中,搜索
TRPG Replay Generator Log
,下载安装本插件; - 在弹出的颜色主题中选择
rgl theme
;
2. Sublime Text RplGenLog 语法插件
本程序内提供了在 Sublime Text 3 中使用的RplGenLog高亮规则。
安装方法:
- 将
RplGenLog.sublime-syntax
文件复制到~\AppData\Roaming\Sublime Text 3\Packages\User
(windows系统)路径下;
cp ./tools_scripts/RplGenLog.sublime-syntax "~/AppData/Roaming/Sublime Text 3/Packages/User/"
- 在Sublime Text中,右下角选择语言为
RplGenLog
;
注意:RplGenLog文件的默认文件格式为
.rgl
3. 海豹骰Log着色器
回声工坊已与海豹骰达成合作;
海豹骰是由木落老师开发的一款新兴的TRPG骰点核心,操作简便易上手,轻量化,可高度自定义。
在海豹骰Log着色器,可以将海豹骰跑团log、其他骰系log、QQ聊天记录等,格式化为RplGenLog格式。
使用方法:
- 删除着色器中,初始化的文本;
- 将外部格式的log复制到着色器中;
- 解析完成后,调整角色名,选择是否添加语音合成标志,然后点击
一键复制
; - 复制到新建文件,保存为
.rgl
格式。
视频引用规范
如果你在你的视频工作流程中使用到回声工坊的相关组件,你可以在发布视频时以以下的任意一种方式来注明引用。
- 在视频的简介中的合适位置注明“本视频使用【回声工坊】制作”,或“本视频由【回声工坊】提供支持”;
- 在视频标签(Tag)中添加“回声工坊”这一Tag;
- 在视频的片头或者片尾添加回声工坊的Logo;
注意:本“视频引用”规范仅仅作为一个友善的建议,并不构成强制要求!注明引用可以便于我们对使用回声工坊的作品进行归档整理和一键三连,并作为开发方向的参考。