创建语音生成任务
说明
Cicada-TTS提供异步语音合成API,适用于长文本的音频合成任务,单次请求长度限制小于4千字。
- 支持上百种系统音色,也可以使用用户定制音色,复刻音色自主选择
- 支持语速和音调的调整
- 支持音频时长的返回
- 支持时间戳(字幕)返回,精确到句
- 支持中英双语克隆
注意: 异步语音合成,QPS 500/min, 具体进度通过查询接口查看
支持模型
以下为Cicada-TTS已提供的语音模型及其特性说明
模型 | 特性 |
---|---|
Cicada-3.0-turbo | 最新的Turbo模型,拥有更加出色的韵律和音色相似度以及稳定性 |
Cicada-3.0 | 拥有出色的韵律和情感,音质表现突出 |
Cicada-2.0 | 拥有出色稳定性和生成速度,音质和韵律表现突出 |
Cicada-1.0 | 拥有出色的稳定性和生成速度 |
使用流程
- 创建定制声音任务,获取定制声音得到的audio_man参数
- 调用创建语音生成任务API,获取 task_id
- 调用查询语音生成任务状态API,基于task_id获取语音合成任务进度
- 当任务状态完成时,上述调用查询语音合成结果API返回的相应JSON获取音频链接和字幕信息
请求地址
http
POST /open/v1/create_audio_task
Header
http
access_token: {{access_token}}
Content-Type: application/json
请求参数Body
参数名称 | 类型 | Nested Key | 是否必传 | 示例 | 说明 |
---|---|---|---|---|---|
audio_man | string | 是 | C-f6254806192e4ef99189ae899d89943e | 声音ID | |
speed | number | 是 | 1 | 语速(范围:0.5x~2x) | |
pitch | number | 是 | 1 | 语调(范围根据声音人类型变化,具体参照类型范围对照表) | |
text | object | text | 是 | 你好,我是你的蝉镜数字人(文本长度限制为4000字以下) | 富文本 |
plain_text | 否 | 你好,我是你的蝉镜数字人 | |||
font_size | number | 否 | 64 | 字幕字体大小(推荐使用默认值) | |
width | number | 否 | 1000 | 每行字幕宽度(推荐使用默认值) | |
height | number | 否 | 90 | 每行字幕高度(推荐使用默认值) | |
callback | string | 否 | "http://127.0.0.1:8012/test_callback" | 回调地址(任务结束后会向该地址发送一个 POST 请求。++请求体的格式和++获取语音合成结果++接口查询结果返回的data相同++) | |
aigc_watermark | bool | 否 | 音频是否加明水印,默认是false |
请求示例
json
{
"audio_man": "C-f7387406192e4ef99189ae899d89943e",
"speed": 1,
"pitch": 1,
"text": {
"text": "你好,我是你的蝉镜数字人",
"plain_text": "你好,我是你的蝉镜数字人"
},
"font_size": 64,
"width": 1000,
"height": 90,
"callback": "http://127.0.0.1:8012/test_callback"
}
响应JSON
json
{
"trace_id": "dd09f123a25b43cf2119a2449daea6de",
"code": 0,
"msg": "success",
"data": {
"task_id": "88f635dd9b8e4a898abb9d4679e0edc8"
}
}
声音类型对应语调范围及效率表(声音类型通过查询声音详情接口获取)
声音类型 | 语调范围 | 生成效率 |
---|---|---|
cicada1.0 | 不支持 | 20-25 字符/秒 |
cicada2.0 | 0.1 ~ 3 / -12 ~ 12 (具体范围咨询客服) | 8-25 字符/秒 |
cicada3.0 | 不支持 | 20-35 字符/秒 |
cicada3.0-turbo | 不支持 | 10-15 字符/秒 |
响应参数
字段 | 说明 |
---|---|
code | 响应状态码 |
msg | 响应消息 |
task_id | 语音合成任务ID |
响应状态码说明
code | 说明 |
---|---|
0 | 响应成功 |
400 | 传入参数格式错误 |
10400 | AccessToken验证失败 |
APP状态错误 | |
缺少 tts 文本 | |
缺少音频文件 | |
输入文本不可以包含 emoji | |
40000 | 参数错误 |
40001 | 超出QPS限制 |
40002 | 制作视频时长到达上限 |
50000 | 系统内部错误 |
没有找到对应的声音ID | |
声音ID对应的audio_man不存在或被禁用 |