SSML
<phoneme>
指定字词发音(音素)
描述
<phoneme>
用于手动指定部分字词的发音。通常用于纠正TTS为多音字自动生成的不准确发音。
属性
参数 | 类型 | 功能 | 取值 |
---|---|---|---|
alphabet | enum | 指定表示发音(音素)的格式 | * 中文 * py 拼音* 英文 * cmu CMU音标格式* ipa 柯林斯美音音标 |
ph | string | 指定发音(音素) | * 不同的 * 参见下文“注意事项”部分 |
拼音
注意事项
- 用于中文前端。
- 使用空格分隔多个拼音。
- 不区分大小写。
- 子元素必须为纯文本,且为一个或多个汉字,不应出现标点符号。
- 声母是可选的。
- 音调包括:
- 1 - 阴平、2 - 阳平、3 - 上声、4 - 去声
- 5 - 轻声
示例
xml
《茜茜公主》是奥地利拍摄的历史题材的德语三部曲电影。
xml
<phoneme alphabet="py" ph="xi1">茜</phoneme><phoneme alphabet="py" ph="xi1">茜</phoneme>公主》是奥地利拍摄的历史题材的德语三部曲电影。
<break time>
插入停顿时间
描述
<break time = 停顿秒数" />
用于手动插入句子的停顿点以及需要停顿的时间。
示例
xml
《茜茜公主》是奥地利(停顿0.5秒)拍摄的历史题材的(停顿0.5秒)德语三部曲电影。
xml
《茜茜公主》是奥地利<break time=\"0.5s\"/>拍摄的历史题材的<break time=\"0.5s\"/>德语三部曲电影。