logo
平台介绍
快速接入
密钥管理
模型列表
计费规则
音色列表
文本转语音
音色克隆
音色克隆介绍
文生音色
语音识别
多模态理解模型
音乐生成
图片生成
视频生成
语音Agent
自定义Agent
常见问题
工作台
立即登录

音色克隆

音色克隆大模型是基于全新自研语音大模型算法打造的高效化、专业级音色定制方案。用户仅需录制秒级别音频,即可快速拥有高保真的专属 AI 定制音色。

产品优势

  • 技术领先:采用全新自研大模型技术,提供行业领先的复刻精度与情感表现力。
  • 超低成本:仅需录制 3-30s 音频即可快速复刻,录制门槛极低。
  • 高度还原:1:1 还原真人音色特点、说话风格、口音和声学细节。
  • 极速复刻:秒级完成模型训练与槽位入库,即刻拥有高品质 AI 定制音色。

使用说明与操作流程

槽位是您使用克隆功能的"存储空间"。

  1. 克隆前提:空余槽位是进行音色克隆的必要条件。只有当您拥有空余槽位时,系统才允许发起新的音色克隆任务。

  2. 存储与调用:每个槽位承载一个已生成的音色。在套餐有效期内,该音色可随时用于平台合成或 API 调用。(文生音色与克隆音色共用一组音色槽位)

  3. 准备与克隆(平台侧):

    • 环境要求:在安静、无回声环境下录制,确保人声纯净。
    • 素材规格:
      • 时长:3-30秒
      • 体积:50MB 以内
      • 格式:MP3/WAV/AAC
    • 操作三步曲:
      1. 添加音频:选择"录制音频"或"上传音频"。
      2. 训练生成:系统自动消耗一个槽位,秒级完成模型训练。
      3. 管理音色:在音色列表查看已生成的音色并使用。
  4. API 规范:

  • 暂不支持通过接口进行克隆:克隆音色 API 暂不支持直接通过接口发起录制或克隆请求。
  • 先克隆后调用:开发者须先在平台消耗槽位完成音色复刻,获取唯一 voice_id 后,再通过 API 传入该 ID 进行调用。

套餐权益与扩容支持

槽位数量由您的套餐等级决定,并随套餐有效期动态调整。

套餐类型槽位数量适用场景扩容路径
免费版1 个基础功能测试与效果预览升级套餐
尝鲜版2 个个人轻度体验,尝试不同声线升级套餐
高级版5 个满足日常多场景、多角色的配音需求升级套餐
专业版8 个适合高频创作者,建立稳定声线库升级套餐
商业版15 个商业化大规模应用,支持多场景集成联系客服定制

槽位不足处理方案

  • 释放空间:您可以删除不再需要的旧音色以释放槽位,腾出空间进行新克隆。
  • 升级套餐:若当前槽位已满,请点击"升级套餐"以即刻获取更多额度。
  • 专属定制:若您已是最高等级(商业版)用户,但仍需更多槽位,请点击右上角"联系客服"并留下您的联系方式。我们的技术服务专员将在 24 小时内与您取得联系,为您提供 1对1 的专属扩容方案。