报错/失败
通用
token的有效期是多久,新获取的token为什么失效了?
答:token的有效期是24个小时。短时间内多次获取了token,重新获取后旧的token会失效。
报错参数错误(code":400,"msg":"参数错误")
答:获取token的请求格式不对,请仔细阅读开放接口通识-获取AccessToken章节。《获取AccessToken》
填了回调地址,但是没有回调
答:接口做了限制导致回调失败。
多并发会出现不是本人的数字人
答:可能是通过列表进行查询的同时没有进行id的匹配,导致保存封面时错乱。
创建任务时报错文字不合法规,是什么原因,是否有更详细的提示( "code": 50011,"msg": "作品存在不合法规文字内容。请修改后重新提交")
答:触发敏感词了,目前没有显示具体的敏感词内容,接下来会补上。
定制数字人
形象克隆失败原因排查
答1:声音质量太差。具体情况如:声音太小、背景音嘈杂、全是念数字。
答2:音频中找不到大于10秒的连续说话片段。
答3:没有声音的视频只能选无声克隆。
答4:检查视频链接是否有误。
定制数字人返回生成超时
答1:声音质量太差了,噪声太多,后续会优化报错信息。
答2:原视频音量过低
使用仅克隆形象的接口,选择的是figure参数,但报错(检测不到声音,请确认麦克风处于录制中,并且保证足够的说话时长)
答:没填train_type参数,默认是要生成声音的。
提交的形象视频报错(不支持的格式)
答1:上传了不支持的视频格式,请上传 mp4、m4a、webm或者mov。
答2:如果格式无误,可能是上传了不支持的url格式,导致提取不到文件后缀,需要https://…….mp4?xxxxx=这种格式才可以,后续会进行优化,目前可以考虑修改成正确的格式重新提交试试。
定制数字人失败,会是人物本身不被系统允许的原因吗?
答:开放接口没有违规检测。
填写了数字人名称,但报错(code400,msg定制数字人名称不能为空)
答:参数有误,请检查参数。
定制数字人训练形象时同时训练声音,从形象里得到的声音id在声音的详情里查询不到
答:这个接口是用来查询定制声音的,定制形象的生成的声音无法通过这个接口查询,目前只支持查询C-Audio开头的声音。
合成视频
合成视频失败原因排查
答1:超出qps限制,需要用户自己做个令牌桶算法来限流排队,目前不支持独立开放限流;用户一分钟内最多提交10个任务,超出需排队
答2:数字人素材人脸部分太小了,或者嘴形不明显,导致数字人用于合成视频失败
答3:接口调错了,请仔细看文档
答4:生成视频的声音必须是定制成功的,判断声音是否成功的方法:定制声音回调/定制声音详情的状态4;
声音定制失败可排查音频问题:音频地址有误;不是公网可访问的在线地址;音频有权限限制无法打开,要核实这个音频文件的链接是否失效了;不支持image格式,无法读取
答5:生成视频请求的text参数没传值
答6:输入文案不支持html
答7:字体不支持,可能含有特殊字符,可以先把特殊字体转换成正常的再试试
答8:tts.text需要是一个字符串数组,需要把双引号改为[ ]
答9:语速不能为0
答10:使用的数字人不存在
答11:传的是纯数字文本
使用「创建视频合成任务」接口没有回调
答:需要填回调地址。
合成视频任务的时候传的音频最长是多少,报错(任务失败,音频过长,请查看接口文档 )
答:音频只支持5min,暂时无法开放时长限制,过长的音频会导致视频无法合成。
取公共数字人,有时候能取到,有时候取不到(code: 50000,msg:"该AI语音被禁用或者不存在")
答:有些音色下线了,可以考虑换个音色。
合成数字人视频的时候还是提示数字人不存在
答:定制该数字人的id与合成视频的id不一致,数字人只归属于定制它的账号,用别的账号是看不到的。
传了tts文本但是还是报错(code: 50000,msg: "缺少 tts 文本")
答:没有传audio_man这个值。
合成视频提示声音id不存在
答1:填错了声音id。
答2:这个声音已经下线了。
报错:没有找到对应的声音
答:跨账号使用声音了。
合成视频停顿处有明显杂音
答1:原始声音中回音很多,针对这种杂讯当前的降噪模块无法有效降噪,可考虑换一下素材或尝试其他声音模型。
答2:原音频质量没有问题,但是长停顿的位置太多了,对声音合成的效果是有影响的,如果能缩减声音停顿次数,效果会好很多。可考虑减少停顿时长,尽量使用0.4s以内的停顿,连续输入停顿符号会自动叠加,目前使用大停顿容易产生问题。
视频转mp4失败
答:上传的webm有误,不是正确的webm编码。
生成的视频中,播放时口播文字顺序有问题
答:建议检查输入的文本的顺序,可以在微信上把文本发出来,检查文字顺序是否本身有颠倒的情况。
数字人朗读文本有缺字漏字
答:原始音频背景噪音比较大,造成吞字漏字的概率会比较高,建议录制音频时尽量降低背景噪音。
字幕断句不对,一句话被分为2-3行文字,如何处理?
答:目前暂时不支持自定义字幕分段。
字幕每次只显示几个字
答:字幕框太小了,导致做字幕打轴的时候字数受到限制。
生成视频被横向或纵向压缩
答:是生成视频时数字人的分辨率与数字人原始的分辨率不符导致的。
生成视频的宽高比例奇怪
答:公共数字人接口有返回形态的宽高,可以基于宽高来定义数字人的x与y位置,尽量不要默认定480。
视频位置出现问题
答:数字人位置传错了,如果希望数字人的左上角与画布的左上角对齐,这个值需要传递0
合成视频出现数字人变形被压缩的情况
答:参数问题,合成视频时定的数字人的分辨率与原分辨率不一致。
生成的视频画面有一条黑线
答:是公共数字人制作的不够好,导致与背景重叠时出现的。
language默认是cn,能设置英文吗?
答:如果有输出英语视频的需要,建议使用英文原音频克隆声音。
api合成视频是否支持用户提供文本、背景音乐和自己的logo?
答:支持提供文字生成带字幕的口播视频,暂不支持自定义上传logo素材和背景音乐。
输出视频url为空是什么原因
答:没有完成的视频合成任务没有url。
选择tts报错“存在不合法规文字内容”
答: 对于tts文本内容输入会有文本敏感词检测,对于在文本语义上触发敏感的暂不会返回对应涉及到的敏感词,除此之外会返回对应的敏感词,用户可以根据返回的敏感词进行内容修改后再提交
定制声音
声音定制任务失败原因排查
答1:传参问题。
答2:音频地址有误
答3:音频地址不能是本地地址,需要公网可访问的在线地址
答4:上传的音频url证书无法校验,可考虑改用http再次尝试。
答5:音频无法打开,有权限限制,要核实这个音频文件的链接是否失效了
答6:不支持image格式,无法读取
答7:目前模型不支持多音字,可去掉多音字标记符号重试。
语音生成
公共音色单独克隆视频可用,但单独克隆音频任务显示该音色已被禁用
答:语音生成任务仅支持定制声音。
语音生成报错“存在不合法规文字内容”
答: 对于文本内容输入会有文本敏感词检测,对于在文本语义上触发敏感的暂不会返回对应涉及到的敏感词,除此之外会返回对应的敏感词,用户可以根据返回的敏感词进行内容修改后再提交