更新日志

2026-06-18

创建定制数字人 API 新增 “is_remove_bg”参数，用于标识该数字人是否需要支持移除背景。
数字人视频合成 API 新增 “is_remove_bg” 参数，用于控制合成时是否移除数字人原背景，
拉取定制数字人列表和详情的接口新增 “is_support_remove_bg”字段，标识该数字人是否支持移除背景。

2026-05-20

语音合成新增方言支持，调整方言使用条件说明

2026-05-08

新增创意雷达接口文档《创意简报》

2026-04-29

新增快乐马模型（i2v、t2v）

2026-04-28

《数字人模板库》 GET /open/v1/list_common_dp：新增查询参数 sort（latest 最新 / hottest 最热；最热按服务端实时统计的使用热度排序）。列表默认返回全部来源的公共数字人（不再提供 source 筛选）。

2026-03-27

文生数字人支持模型选择，详情请见《生成数字人图片》和《生成数字人视频》

2026-03-25

新增开放接口《标签字典》：GET /open/v1/tag_list，按业务类型返回标签大类及启用标签（可与公共数字人筛选联动）。
《数字人模板库》（公共数字人列表）：GET /open/v1/list_common_dp 增加查询参数 source、tag_ids（多标签 AND 交集）；列表项增加 tag_ids、tag_names。
视频合成支持卡通形象模型驱动，详情请见《合成数字人视频》

2026-03-06

新增 AI 创作模型文档，覆盖图片生成（可灵、即梦、万相）与视频生成（可灵、海螺、豆包、vidu 等）多个模型

2026-02-11

新增视频对口型能力，详情请见《口型驱动》

2025-12-22

cicada1.0语音模型升级

一、极速克隆：高效低成本，即刻拥有专属音色

1、15秒超短音频快速复刻：无需大量录音素材，仅需 10 秒清晰语音，即可一键生成高度相似的专属音色模型，降低克隆门槛与时间成本。

2、零专业门槛操作：无需复杂参数调试，支持多种语音场景采样（日常对话、朗读、情感表达均可），新手也能快速上手完成克隆。

二、高保真还原：不止像，更像 “活” 的声音

1、音色 + 韵律双优复刻：精准还原原声的声线特质（如音色厚度、音域范围、发音习惯、环境噪音等等），更攻克韵律难点，复刻断句、重音、语调起伏等细节。

2、核心突破：情绪韵律精准捕捉：区别于普通 TTS 的 “机械复刻”，重点还原原声的情绪特质（如喜悦、沉稳、温柔、激昂等），让合成语音自带 “情感温度”，告别生硬朗读感。

3、多场景适配还原：无论是新闻播报的严谨、故事讲述的生动，还是客服对话的亲和，都能精准复刻对应场景下的语音韵律与情绪基调。

2025-12-09

支持4k数字人定制，详情请见文档
定制数字人支持4k视频合成，详情请见文档

2025-10-31

视频合成高质版[蝉镜lip-sync pro]计费由4蝉豆/秒降为2蝉豆/秒。

2025-10-20

ssml新增<ttnumber>标签，用于指定数字读法。

2025-10-11

语音生成添加音色转换接口，支持特定声音人使用音色转换功能；文件管理添加详情接口与状态字段

2025-09-08

定制数字人添加错误跳过参数，目前支持跳过声音克隆失败（声音分离失败、高质量音频裁剪失败），跳过后定制数字人列表/详情的audio_id将为空值

2025-08-27

2025 年 9 月 19 日将下线公共数字人形象：浩然-专业：ef8686976ecd470a84f81b9030bae034

2025-08-14

创建视频新增是否添加 AI 作品水印《合成数字人视频》

2025-07-24

文件管理功能上线，支持定制数字人使用文件管理上传的文件《文件管理》

2025-07-22

开放接口定制数字人并发处理任务数调整：从无限制调整为50。《定制数字人》

2025-07-15

新增获取蝉豆余额情况《获取蝉豆余额情况》

2025-06-06

更换请求地址，原地址仍可用

2025-04-18

支持合成视频删除《合成数字人视频》
支持语音合成服务《语音合成》

2025-02-14

支持指定数字人视频驱动顺序，详情参考创建视频合成任务参数《合成数字人视频》

2025-02-14

生成视频时返回字幕时间轴，时间轴字段说明参考：《合成数字人视频》，使用该功能需要正常配置请求参数中的subtitle_config，生成字幕的同时会同时将字幕时间轴返回。

2025-02-08

支持生成四通道 webm 视频

2024-12-26

支持单独定制声音

2024-12-19

创建视频合成任务，支持上传 m4a 音频格式

2024-12-06

定制数字人，增加训练类型train_type参数

2024-08-21

合成视频，增加驱动模式person.drive_mode参数

2024-08-19

创建视频合成任务，支持上传背景图片bg参数

2024-08-15

获取通用数字人接口
合成视频支持通用数字人

2024-08-13

增加用户数据接口

2024-08-08

增加获取形象和视频单个查询接口
视频数据增加返回时长字段（仅对新视频生效）

2024-07-22

增加训练形象和创建视频合成人物QPS限制， 1/min

2024-07-17

生成数字人和创建合成视频基础能力