阿里云接口批量文本转语音工具 批量音频生成工具




KEY的获取方式 https://help.aliyun.com/zh/model-studio/get-api-key
### 核心功能
- **批量转换**:支持将多个TXT文本文件一次性批量转换为MP3音频文件
- **音色选择**:提供丰富的音色库,支持实时音色试听功能
- **音频管理**:自动下载、管理音频文件,优先使用本地音频文件
- **转换控制**:支持转换过程中的暂停、继续和终止操作
- **防重复执行**:智能检测任务状态,防止重复启动转换任务
- **文件名保持**:使用原始TXT文件名保存MP3文件,不添加时间戳后缀
- **单次转换**:支持单个文本的即时转换和播放
免费额度(注)
2025年11月15日0点前开通阿里云百炼:2000字符
2025年11月15日0点后开通阿里云百炼:1万字符
有效期:阿里云百炼开通后90天内
cosyvoice-v3-flash 1元/万字符
cosyvoice-v2 2元/万字符
语音合成文本限制与格式规范
文本长度限制
非流式调用或单向流式调用:单次发送文本长度不得超过 20000 字符。
双向流式调用:单次发送文本长度不得超过 20000 字符,且累计发送文本总长度不得超过 20 万字符。
字符计算规则
汉字(包括简/繁体汉字、日文汉字和韩文汉字)按2个字符计算,其他所有字符(如标点符号、字母、数字、日韩文假名/谚文等)均按 1个字符计算
计算文本长度时,不包含SSML 标签内容
示例:
"你好" → 2(你)+2(好)=4字符
"中A文123" → 2(中)+1(A)+2(文)+1(1)+1(2)+1(3)=8字符
"中文。" → 2(中)+2(文)+1(。)=5字符
"中 文。" → 2(中)+1(空格)+2(文)+1(。)=6字符
"<speak>你好</speak>" → 2(你)+2(好)=4字符
编码格式
需采用UTF-8编码。
