创建口音合成任务

说明

Cicada-TTS的语音模型提供口音合成能力，支持用户选取相应的口音并且上传一段个人的音色，即可合成具备个人音色和特定口音的音频。

使用流程

口音合成的实现具体流程如下:

通过文件管理上传自己的音色文件，并获取prompt_audio的参数
咨询客服或者售后人员获取口音id信息
上传待合成的文本信息 (文本长度不能超过4000字)
调用口音合成任务并获取task_id
根据task_id调用获取语音合成结果的接口，获取相应的音频信息

注意: 此接口为异步任务，具体进度通过查询接口查看，计费：0.2蝉豆/秒，RPM为200

更多口音请咨询客服或对应售后人员

声音人名称	模型	口音id
四川男年轻	cicada3.0-turbo	89843d52ccd04e2d854decd28d6143ce
南京男年轻	cicada3.0-turbo	b9705cff084c4416b02f01d797025c25
陕西男年轻	cicada3.0-turbo	f28c22c6d26f48f29ee4cc1380adff24
天津年轻男	cicada3.0-turbo	2c9f4ce01f254b5e9408e5af3b464900
天津年迈女	cicada3.0-turbo	eb370cde929049d9b36debcb6161f053
东北年轻男	cicada3.0-turbo	4027dfc73c6e4235911dba293f53e62f
台湾口音男	cicada3.0-turbo	63dd6a2bf2c54cbe828154f393e5d833
闽南口音女	cicada3.0-turbo	1880b61fc567431aafe35266057a6585
北京年轻男	cicada3.0-turbo	8a18396b48b54d5f8d4143369145d357
东北年迈女	cicada3.0-turbo	ed5eea52f94045198e9ec7c45e54fb96
河南年迈女	cicada3.0-turbo	737b5b61343640139f539767c03be495
四川年轻女	cicada3.0-turbo	74afc28ab43544669f50773449acf2b5

请求地址

http

POST /open/v1/create_audio_task_v2

http

access_token: {{access_token}}
Content-Type: application/json

请求参数Body

参数名称	类型	Nested Key	是否必传	示例	说明
audio_man	string		是	C-f6254806192e4ef99189ae899d89943e	声音ID
speed	number		是	1	语速（范围:0.5x～2x）
pitch	number		是	1	语调（范围根据声音人类型变化，具体参照类型范围对照表）
text	object	text	是	你好，我是你的蝉镜数字人（文本长度限制为4000字以下）	富文本
		plain_text	否	你好，我是你的蝉镜数字人
callback	string		否	"http://127.0.0.1:8012/test_callback"	回调地址（任务结束后会向该地址发送一个 POST 请求。++请求体的格式和++获取语音合成结果++接口查询结果返回的data相同++）
aigc_watermark	bool		否	false	音频是否加明水印，默认是false
prompt_audio	string		否	09eacb8ead0a423e9dcd75065ae32d25	音色prompt，使用特定口音的声音人+音色prompt可以实现让对应音色使用特定口音发音，来自通过文件管理上传的音色文件
mss	number		是	10	AI断句字数，替换原本的font_size、width、height

请求示例

json

{
    "audio_man": "C-f7387406192e4ef99189ae899d89943e",
    "speed": 1,
    "pitch": 1,
    "text": {
        "text": "你好，我是你的蝉镜数字人",
        "plain_text": "你好，我是你的蝉镜数字人"
    },
    "callback": "http://127.0.0.1:8012/test_callback",
    "prompt_audio": "09eacb8ead0a423e9dcd75065ae32d25",
    "mss": 10
}

响应JSON

json

{
    "trace_id": "dd09f123a25b43cf2119a2449daea6de",
    "code": 0,
    "msg": "success",
    "data": {
        "task_id": "88f635dd9b8e4a898abb9d4679e0edc8"
    }
}

声音类型对应语调范围及效率表（声音类型通过查询声音详情接口获取）

声音类型	语调范围	生成效率
cicada1.0	不支持	20-25 字符/秒
cicada2.0	0.1 ～ 3 / -12 ~ 12 (具体范围咨询客服)	8-25 字符/秒
cicada3.0	不支持	20-35 字符/秒
cicada3.0-turbo	不支持	10-15 字符/秒

响应参数

字段	说明
code	响应状态码
msg	响应消息
task_id	语音合成任务ID

响应状态码说明

code	说明
0	响应成功
400	传入参数格式错误
10400	AccessToken验证失败
	APP状态错误
	缺少 tts 文本
	缺少音频文件
	输入文本不可以包含 emoji
40000	参数错误
40001	超出QPS限制
40002	制作视频时长到达上限
50000	系统内部错误
	没有找到对应的声音ID
	声音ID对应的audio_man不存在或被禁用

创建口音合成任务 ​

说明 ​

使用流程 ​

请求地址 ​

Header ​

请求参数Body ​

请求示例 ​

响应JSON ​

声音类型对应语调范围及效率表（声音类型通过查询声音详情接口获取） ​

响应参数 ​

响应状态码说明 ​

创建口音合成任务

说明

使用流程

请求地址

Header

请求参数Body

请求示例

响应JSON

声音类型对应语调范围及效率表（声音类型通过查询声音详情接口获取）

响应参数

响应状态码说明