Skip to content

更新日志

2026-03-27

2026-03-25

  • 新增开放接口 《标签字典》GET /open/v1/common/tag_list,按业务类型返回标签大类及启用标签(可与公共数字人筛选联动)。
  • 《公共数字人》GET /open/v1/list_common_dp 增加查询参数 sourcetag_ids(多标签 AND 交集);列表项增加 tag_idstag_names
  • 视频合成支持卡通形象模型驱动,详情请见《创建视频合成任务》

2026-02-11

2025-12-22

  • cicada1.0语音模型升级

一、 极速克隆:高效低成本,即刻拥有专属音色

1、15秒超短音频快速复刻:无需大量录音素材,仅需 10 秒清晰语音,即可一键生成高度相似的专属音色模型,降低克隆门槛与时间成本。

2、零专业门槛操作:无需复杂参数调试,支持多种语音场景采样(日常对话、朗读、情感表达均可),新手也能快速上手完成克隆。

二、 高保真还原:不止像,更像 “活” 的声音

1、音色 + 韵律双优复刻:精准还原原声的声线特质(如音色厚度、音域范围、发音习惯、环境噪音等等),更攻克韵律难点,复刻断句、重音、语调起伏等细节。

2、核心突破:情绪韵律精准捕捉:区别于普通 TTS 的 “机械复刻”,重点还原原声的情绪特质(如喜悦、沉稳、温柔、激昂等),让合成语音自带 “情感温度”,告别生硬朗读感。

3、多场景适配还原:无论是新闻播报的严谨、故事讲述的生动,还是客服对话的亲和,都能精准复刻对应场景下的语音韵律与情绪基调。

2025-12-09

  • 支持4k数字人定制,详情请见文档
  • 定制数字人支持4k视频合成,详情请见文档

2025-10-31

  • 视频合成高质版[蝉镜lip-sync pro]计费由4蝉豆/秒降为2蝉豆/秒。

2025-10-20

  • ssml新增<ttnumber>标签,用于指定数字读法。

2025-10-11

  • 语音生成添加音色转换接口,支持特定声音人使用音色转换功能;文件管理添加详情接口与状态字段

2025-09-08

  • 定制数字人添加错误跳过参数,目前支持跳过声音克隆失败(声音分离失败、高质量音频裁剪失败),跳过后定制数字人列表/详情的audio_id将为空值

2025-08-27

  • 2025 年 9 月 19 日将下线公共数字人形象: 浩然-专业:ef8686976ecd470a84f81b9030bae034

2025-08-14

2025-07-24

  • 文件管理功能上线,支持定制数字人使用文件管理上传的文件《文件管理》

2025-07-22

2025-07-15

2025-06-06

  • 更换请求地址,原地址仍可用

2025-04-18

2025-02-14

2025-02-14

  • 生成视频时返回字幕时间轴,时间轴字段说明参考:《获取视频详情》,使用该功能需要正常配置请求参数中的subtitle_config,生成字幕的同时会同时将字幕时间轴返回。

2025-02-08

  • 支持生成四通道 webm 视频

2024-12-26

  • 支持单独定制声音

2024-12-19

  • 创建视频合成任务,支持上传 m4a 音频格式

2024-12-06

  • 定制数字人,增加训练类型train_type参数

2024-08-21

  • 合成视频,增加驱动模式person.drive_mode参数

2024-08-19

  • 创建视频合成任务,支持上传背景图片bg参数

2024-08-15

  • 获取通用数字人接口

  • 合成视频支持通用数字人

2024-08-13

  • 增加用户数据接口

2024-08-08

  • 增加获取形象和视频单个查询接口

  • 视频数据增加返回时长字段(仅对新视频生效)

2024-07-22

  • 增加训练形象和创建视频合成人物QPS限制, 1/min

2024-07-17

  • 生成数字人和创建合成视频基础能力