text-to-speech

文本转语音工具，支持命令行和 Python API。

功能特性

支持文本转语音
支持多种说话人
流式输出支持
命令行工具和 Python API 两种使用方式
Provider 抽象层，可扩展支持不同 TTS 服务

安装

从源码安装

cd text-to-speech
pip install -e .

使用 pip 安装

pip install text-to-speech

配置

各 Provider 通过环境变量配置，创建 .env 文件：

# StreamTTSProvider 配置
TTS_URL=http://your-tts-server:8002/tts_stream

或直接设置环境变量：

export TTS_URL="http://your-tts-server:8002/tts_stream"

注意: 不同的 Provider 有各自的配置项，通过环境变量管理，CLI 只暴露通用参数。

命令行使用

基本用法

# 进入目录并激活虚拟环境
cd text-to-speech
source venv/bin/activate

# 直接输入文本（使用默认 StreamTTSProvider）
python -m text_to_speech "你好世界" -o output.wav

# 从文件读取文本
python -m text_to_speech -i input.txt -o output.wav

# 使用本地 TTS（无需网络）
python -m text_to_speech "你好世界" -o output.wav --provider local

选项

# 指定说话人
python -m text_to_speech "你好世界" -o output.wav --spk-id female

# 列出可用的 providers
python -m text_to_speech --list-providers

# 列出可用的音色
python -m text_to_speech --list-voices

# 详细输出
python -m text_to_speech "你好世界" -o output.wav -v

命令行参数

参数	说明
`text`	要转换的文本内容
`-i, --input`	输入文本文件路径
`-o, --output`	输出音频文件路径（必需）
`--spk-id`	说话人 ID（默认 xiaoyan），使用 `--list-voices` 查看可用 ID
`--provider`	TTS provider 名称（默认 default）
`--list-providers`	列出所有可用的 TTS providers
`--list-voices`	列出所有可用的音色
`-v, --verbose`	详细输出
`--version`	显示版本号

Python API

基本用法

from text_to_speech import TTSClient

# 创建客户端
client = TTSClient(content="你好世界", spk_id="xiaoyan")

# 转换并保存
audio = client.convert(output_path="output.wav")

使用自定义 Provider

from text_to_speech import TTSClient, StreamTTSProvider

# 创建自定义 provider
provider = StreamTTSProvider(url="http://custom-server:8002/tts")

# 使用 provider 创建客户端
client = TTSClient(content="你好世界", provider=provider)
audio = client.convert(output_path="output.wav")

使用回调函数

from text_to_speech import TTSClient, TTSResult

def on_progress(result: TTSResult):
    if result.type == 0:
        print(f"Processing: received {len(result.audio)} bytes")
    elif result.type == 1:
        print("Completed!")
    else:
        print(f"Error: {result.message}")

client = TTSClient(
    content="你好世界",
    spk_id="xiaoyan",
    callback=on_progress
)
client.start()

便捷函数

from text_to_speech import text_to_speech

# 一行代码完成转换
audio = text_to_speech("你好世界", output_path="output.wav")

扩展 TTS 服务

通过实现 TTSProvider 基类，可以添加新的 TTS 服务支持：

from text_to_speech.providers import TTSProvider
from typing import Iterator

class MyTTSProvider(TTSProvider):
    def __init__(self, api_key: str, ...):
        self.api_key = api_key
    
    def synthesize(self, text: str, spk_id: str) -> Iterator[bytes]:
        # 实现你的 TTS 服务调用逻辑
        # 返回音频数据流
        ...
        yield audio_chunk

# 使用自定义 provider
provider = MyTTSProvider(api_key="xxx")
client = TTSClient(content="你好", provider=provider)

API 参考

TTSClient

TTSClient(
    content: str,              # 要转换的文本
    spk_id: str = "xiaoyan",   # 说话人 ID
    callback: Callable = None, # 进度回调
    provider: TTSProvider = None, # TTS 服务提供者
    tts_url: str = None        # TTS 服务 URL（向后兼容）
)

TTSResult

@dataclass
class TTSResult:
    type: int       # 0=处理中, 1=完成, -1=错误
    message: str    # 错误消息
    audio: bytes    # 音频数据
    process: int    # 处理进度

TTSProvider

class TTSProvider(ABC):
    @abstractmethod
    def synthesize(self, text: str, spk_id: str) -> Iterator[bytes]:
        """将文本转换为语音，返回音频数据流"""
        pass

作为模块运行

python -m text_to_speech "你好世界" -o output.wav

License

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
text_to_speech		text_to_speech
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

text-to-speech

功能特性

安装

从源码安装

使用 pip 安装

配置

命令行使用

基本用法

选项

命令行参数

Python API

基本用法

使用自定义 Provider

使用回调函数

便捷函数

扩展 TTS 服务

API 参考

TTSClient

TTSResult

TTSProvider

作为模块运行

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

text-to-speech

功能特性

安装

从源码安装

使用 pip 安装

配置

命令行使用

基本用法

选项

命令行参数

Python API

基本用法

使用自定义 Provider

使用回调函数

便捷函数

扩展 TTS 服务

API 参考

TTSClient

TTSResult

TTSProvider

作为模块运行

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages