Skip to content

SSML

<phoneme>指定字词发音(音素)

描述

<phoneme>用于手动指定部分字词的发音。通常用于纠正TTS为多音字自动生成的不准确发音。

属性

参数类型功能取值
alphabetenum指定表示发音(音素)的格式* 中文

* py拼音

* 英文

* cmu CMU音标格式

* ipa柯林斯美音音标
phstring指定发音(音素)* 不同的

* 参见下文“注意事项”部分

拼音

注意事项

  • 用于中文前端。
  • 使用空格分隔多个拼音。
  • 不区分大小写。
  • 子元素必须为纯文本,且为一个或多个汉字,不应出现标点符号。
  • 声母是可选的。
  • 音调包括:
    • 1 - 阴平、2 - 阳平、3 - 上声、4 - 去声
    • 5 - 轻声

示例

xml
《茜茜公主》是奥地利拍摄的历史题材的德语三部曲电影。
xml
<phoneme alphabet="py" ph="xi1">茜</phoneme><phoneme alphabet="py" ph="xi1">茜</phoneme>公主》是奥地利拍摄的历史题材的德语三部曲电影。

<break time>插入停顿时间

描述

<break time = 停顿秒数" />用于手动插入句子的停顿点以及需要停顿的时间。

示例

xml
《茜茜公主》是奥地利(停顿0.5秒)拍摄的历史题材的(停顿0.5秒)德语三部曲电影。
xml
《茜茜公主》是奥地利<break time=\"0.5s\"/>拍摄的历史题材的<break time=\"0.5s\"/>德语三部曲电影。