Skip to content

报错/失败

通用

token的有效期是多久,新获取的token为什么失效了?

答:token的有效期是24个小时。短时间内多次获取了token,重新获取后旧的token会失效。

报错参数错误(code":400,"msg":"参数错误")

答:获取token的请求格式不对,请仔细阅读开放接口通识-获取AccessToken章节。《获取AccessToken》

填了回调地址,但是没有回调

答:接口做了限制导致回调失败。

多并发会出现不是本人的数字人

答:可能是通过列表进行查询的同时没有进行id的匹配,导致保存封面时错乱。

创建任务时报错文字不合法规,是什么原因,是否有更详细的提示( "code": 50011,"msg": "作品存在不合法规文字内容。请修改后重新提交")

答:触发敏感词了,目前没有显示具体的敏感词内容,接下来会补上。

定制数字人

形象克隆失败原因排查

答1:声音质量太差。具体情况如:声音太小、背景音嘈杂、全是念数字。

答2:音频中找不到大于10秒的连续说话片段。

答3:没有声音的视频只能选无声克隆。

答4:检查视频链接是否有误。

定制数字人返回生成超时

答1:声音质量太差了,噪声太多,后续会优化报错信息。

答2:原视频音量过低

使用仅克隆形象的接口,选择的是figure参数,但报错(检测不到声音,请确认麦克风处于录制中,并且保证足够的说话时长)

答:没填train_type参数,默认是要生成声音的。

提交的形象视频报错(不支持的格式)

答1:上传了不支持的视频格式,请上传 mp4、m4a、webm或者mov。

答2:如果格式无误,可能是上传了不支持的url格式,导致提取不到文件后缀,需要https://…….mp4?xxxxx=这种格式才可以,后续会进行优化,目前可以考虑修改成正确的格式重新提交试试。

定制数字人失败,会是人物本身不被系统允许的原因吗?

答:开放接口没有违规检测。

填写了数字人名称,但报错(code400,msg定制数字人名称不能为空)

答:参数有误,请检查参数。

定制数字人训练形象时同时训练声音,从形象里得到的声音id在声音的详情里查询不到

答:这个接口是用来查询定制声音的,定制形象的生成的声音无法通过这个接口查询,目前只支持查询C-Audio开头的声音。

合成视频

合成视频失败原因排查

答1:超出qps限制,需要用户自己做个令牌桶算法来限流排队,目前不支持独立开放限流;用户一分钟内最多提交10个任务,超出需排队

答2:数字人素材人脸部分太小了,或者嘴形不明显,导致数字人用于合成视频失败

答3:接口调错了,请仔细看文档

答4:生成视频的声音必须是定制成功的,判断声音是否成功的方法:定制声音回调/定制声音详情的状态4;

声音定制失败可排查音频问题:音频地址有误;不是公网可访问的在线地址;音频有权限限制无法打开,要核实这个音频文件的链接是否失效了;不支持image格式,无法读取

答5:生成视频请求的text参数没传值

答6:输入文案不支持html

答7:字体不支持,可能含有特殊字符,可以先把特殊字体转换成正常的再试试

答8:tts.text需要是一个字符串数组,需要把双引号改为[ ]

答9:语速不能为0

答10:使用的数字人不存在

答11:传的是纯数字文本

使用「创建视频合成任务」接口没有回调

答:需要填回调地址。

合成视频任务的时候传的音频最长是多少,报错(任务失败,音频过长,请查看接口文档 )

答:音频只支持5min,暂时无法开放时长限制,过长的音频会导致视频无法合成。

取公共数字人,有时候能取到,有时候取不到(code: 50000,msg:"该AI语音被禁用或者不存在")

答:有些音色下线了,可以考虑换个音色。

合成数字人视频的时候还是提示数字人不存在

答:定制该数字人的id与合成视频的id不一致,数字人只归属于定制它的账号,用别的账号是看不到的。

传了tts文本但是还是报错(code: 50000,msg: "缺少 tts 文本")

答:没有传audio_man这个值。

合成视频提示声音id不存在

答1:填错了声音id。

答2:这个声音已经下线了。

报错:没有找到对应的声音

答:跨账号使用声音了。

合成视频停顿处有明显杂音

答1:原始声音中回音很多,针对这种杂讯当前的降噪模块无法有效降噪,可考虑换一下素材或尝试其他声音模型。

答2:原音频质量没有问题,但是长停顿的位置太多了,对声音合成的效果是有影响的,如果能缩减声音停顿次数,效果会好很多。可考虑减少停顿时长,尽量使用0.4s以内的停顿,连续输入停顿符号会自动叠加,目前使用大停顿容易产生问题。

视频转mp4失败

答:上传的webm有误,不是正确的webm编码。

生成的视频中,播放时口播文字顺序有问题

答:建议检查输入的文本的顺序,可以在微信上把文本发出来,检查文字顺序是否本身有颠倒的情况。

数字人朗读文本有缺字漏字

答:原始音频背景噪音比较大,造成吞字漏字的概率会比较高,建议录制音频时尽量降低背景噪音。

字幕断句不对,一句话被分为2-3行文字,如何处理?

答:目前暂时不支持自定义字幕分段。

字幕每次只显示几个字

答:字幕框太小了,导致做字幕打轴的时候字数受到限制。

生成视频被横向或纵向压缩

答:是生成视频时数字人的分辨率与数字人原始的分辨率不符导致的。

生成视频的宽高比例奇怪

答:公共数字人接口有返回形态的宽高,可以基于宽高来定义数字人的x与y位置,尽量不要默认定480。

视频位置出现问题

答:数字人位置传错了,如果希望数字人的左上角与画布的左上角对齐,这个值需要传递0

image.png

合成视频出现数字人变形被压缩的情况

答:参数问题,合成视频时定的数字人的分辨率与原分辨率不一致。

生成的视频画面有一条黑线

答:是公共数字人制作的不够好,导致与背景重叠时出现的。

language默认是cn,能设置英文吗?

答:如果有输出英语视频的需要,建议使用英文原音频克隆声音。

答:支持提供文字生成带字幕的口播视频,暂不支持自定义上传logo素材和背景音乐。

输出视频url为空是什么原因

答:没有完成的视频合成任务没有url。

选择tts报错“存在不合法规文字内容”

答:   对于tts文本内容输入会有文本敏感词检测,对于在文本语义上触发敏感的暂不会返回对应涉及到的敏感词,除此之外会返回对应的敏感词,用户可以根据返回的敏感词进行内容修改后再提交

定制声音

声音定制任务失败原因排查

答1:传参问题。

答2:音频地址有误

答3:音频地址不能是本地地址,需要公网可访问的在线地址

答4:上传的音频url证书无法校验,可考虑改用http再次尝试。

答5:音频无法打开,有权限限制,要核实这个音频文件的链接是否失效了

答6:不支持image格式,无法读取

答7:目前模型不支持多音字,可去掉多音字标记符号重试。

语音生成

公共音色单独克隆视频可用,但单独克隆音频任务显示该音色已被禁用

答:语音生成任务仅支持定制声音。

语音生成报错“存在不合法规文字内容”

答:   对于文本内容输入会有文本敏感词检测,对于在文本语义上触发敏感的暂不会返回对应涉及到的敏感词,除此之外会返回对应的敏感词,用户可以根据返回的敏感词进行内容修改后再提交