阿里云接口批量文本转语音工具 批量音频生成工具

20260203204105202602032040302026020320405520260203204046


KEY的获取方式 https://help.aliyun.com/zh/model-studio/get-api-key

### 核心功能
- **批量转换**:支持将多个TXT文本文件一次性批量转换为MP3音频文件
- **音色选择**:提供丰富的音色库,支持实时音色试听功能
- **音频管理**:自动下载、管理音频文件,优先使用本地音频文件
- **转换控制**:支持转换过程中的暂停、继续和终止操作
- **防重复执行**:智能检测任务状态,防止重复启动转换任务
- **文件名保持**:使用原始TXT文件名保存MP3文件,不添加时间戳后缀
- **单次转换**:支持单个文本的即时转换和播放

免费额度(注)

2025年11月15日0点前开通阿里云百炼:2000字符

2025年11月15日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

cosyvoice-v3-flash  1元/万字符

cosyvoice-v2  2元/万字符

语音合成文本限制与格式规范

文本长度限制


    非流式调用或单向流式调用:单次发送文本长度不得超过 20000 字符。

    双向流式调用:单次发送文本长度不得超过 20000 字符,且累计发送文本总长度不得超过 20 万字符。


字符计算规则

    汉字(包括简/繁体汉字、日文汉字和韩文汉字)按2个字符计算,其他所有字符(如标点符号、字母、数字、日韩文假名/谚文等)均按 1个字符计算

    计算文本长度时,不包含SSML 标签内容


    示例:


        "你好" → 2(你)+2(好)=4字符

        "中A文123" → 2(中)+1(A)+2(文)+1(1)+1(2)+1(3)=8字符

        "中文。" → 2(中)+2(文)+1(。)=5字符

        "中 文。" → 2(中)+1(空格)+2(文)+1(。)=6字符

        "<speak>你好</speak>" → 2(你)+2(好)=4字符


编码格式

需采用UTF-8编码。

软件下载地址 https://wwblv.lanzoul.com/iSP6y3hou49i