更新日志
2026-03-27
2026-03-25
- 新增开放接口 《标签字典》:
GET /open/v1/common/tag_list,按业务类型返回标签大类及启用标签(可与公共数字人筛选联动)。 - 《公共数字人》:
GET /open/v1/list_common_dp增加查询参数source、tag_ids(多标签 AND 交集);列表项增加tag_ids、tag_names。 - 视频合成支持卡通形象模型驱动,详情请见《创建视频合成任务》
2026-02-11
- 新增视频对口型能力,详情请见《创建对口型任务》
2025-12-22
- cicada1.0语音模型升级
一、 极速克隆:高效低成本,即刻拥有专属音色
1、15秒超短音频快速复刻:无需大量录音素材,仅需 10 秒清晰语音,即可一键生成高度相似的专属音色模型,降低克隆门槛与时间成本。
2、零专业门槛操作:无需复杂参数调试,支持多种语音场景采样(日常对话、朗读、情感表达均可),新手也能快速上手完成克隆。
二、 高保真还原:不止像,更像 “活” 的声音
1、音色 + 韵律双优复刻:精准还原原声的声线特质(如音色厚度、音域范围、发音习惯、环境噪音等等),更攻克韵律难点,复刻断句、重音、语调起伏等细节。
2、核心突破:情绪韵律精准捕捉:区别于普通 TTS 的 “机械复刻”,重点还原原声的情绪特质(如喜悦、沉稳、温柔、激昂等),让合成语音自带 “情感温度”,告别生硬朗读感。
3、多场景适配还原:无论是新闻播报的严谨、故事讲述的生动,还是客服对话的亲和,都能精准复刻对应场景下的语音韵律与情绪基调。
2025-12-09
- 支持4k数字人定制,详情请见文档
- 定制数字人支持4k视频合成,详情请见文档
2025-10-31
- 视频合成高质版[蝉镜lip-sync pro]计费由4蝉豆/秒降为2蝉豆/秒。
2025-10-20
- ssml新增
<ttnumber>标签,用于指定数字读法。
2025-10-11
- 语音生成添加音色转换接口,支持特定声音人使用音色转换功能;文件管理添加详情接口与状态字段
2025-09-08
- 定制数字人添加错误跳过参数,目前支持跳过声音克隆失败(声音分离失败、高质量音频裁剪失败),跳过后定制数字人列表/详情的audio_id将为空值
2025-08-27
- 2025 年 9 月 19 日将下线公共数字人形象: 浩然-专业:ef8686976ecd470a84f81b9030bae034
2025-08-14
- 创建视频新增是否添加 AI 作品水印《创建视频合成任务》
2025-07-24
- 文件管理功能上线,支持定制数字人使用文件管理上传的文件《文件管理》
2025-07-22
- 开放接口定制数字人并发处理任务数调整:从无限制调整为50。《定制数字人并发限制》
2025-07-15
- 新增获取蝉豆余额情况 《获取蝉豆余额情况》
2025-06-06
- 更换请求地址,原地址仍可用
2025-04-18
2025-02-14
- 支持指定数字人视频驱动顺序,详情参考创建视频合成任务参数《创建视频合成任务》
2025-02-14
- 生成视频时返回字幕时间轴,时间轴字段说明参考:《获取视频详情》,使用该功能需要正常配置请求参数中的subtitle_config,生成字幕的同时会同时将字幕时间轴返回。
2025-02-08
- 支持生成四通道 webm 视频
2024-12-26
- 支持单独定制声音
2024-12-19
- 创建视频合成任务,支持上传 m4a 音频格式
2024-12-06
- 定制数字人,增加训练类型
train_type参数
2024-08-21
- 合成视频,增加驱动模式
person.drive_mode参数
2024-08-19
- 创建视频合成任务,支持上传背景图片
bg参数
2024-08-15
获取通用数字人接口
合成视频支持通用数字人
2024-08-13
- 增加用户数据接口
2024-08-08
增加获取形象和视频单个查询接口
视频数据增加返回时长字段(仅对新视频生效)
2024-07-22
- 增加训练形象和创建视频合成人物QPS限制, 1/min
2024-07-17
- 生成数字人和创建合成视频基础能力