[ SKILL_DOCUMENTATION ]
# CLI 参考 (`scripts/text_to_speech.py`)
此文件包含捆绑的语音生成 CLI 的“命令目录”。请保持 `SKILL.md` 为概览优先;详细的 CLI 细节请放在此处。
## 此 CLI 的功能
- `speak`: 生成单个音频文件
- `speak-batch`: 从 JSONL 文件运行多个任务(每行一个任务)
- `list-voices`: 列出支持的语音
真实的 API 调用需要网络访问权限 + `OPENAI_API_KEY`。`--dry-run` 则不需要。
## 快速入门(适用于任何仓库)
设置技能 CLI 的稳定路径(默认 `CODEX_HOME` 为 `~/.codex`):
export CODEX_HOME="${CODEX_HOME:-$HOME/.codex}"
export TTS_GEN="$CODEX_HOME/skills/speech/scripts/text_to_speech.py"
空运行(无 API 调用;无需网络;不需要 `openai` 包):
python "$TTS_GEN" speak --input "Test" --dry-run
生成(需要 `OPENAI_API_KEY` + 网络):
uv run --with openai python "$TTS_GEN" speak
--input "Today is a wonderful day to build something people love!"
--voice cedar
--instructions "Voice Affect: Warm and composed. Tone: upbeat and encouraging."
--response-format mp3
--out speech.mp3
没有安装 `uv`?使用你当前的 Python 环境:
python "$TTS_GEN" speak --input "Hello" --voice cedar --out speech.mp3
## 防护栏(重要)
- 所有 TTS 工作请使用 `python "$TTS_GEN" ...`(或等效的完整路径)。
- 除非用户明确要求,否则**不要**创建一次性运行脚本(例如 `gen_audio.py`)。
- **严禁修改** `scripts/text_to_speech.py`。如果缺少某些功能,请在采取任何行动前先询问用户。
## 默认值(除非被标志覆盖)
- 模型: `gpt-4o-mini-tts-2025-12-15`
- 语音: `cedar`
- 响应格式: `mp3`
- 语速: `1.0`
- 批处理速率限制: `50`
## 输入限制
- 每次请求的输入文本必须 tmp/speech/jobs.jsonl << 'JSONL'
{"input":"Thank you for calling. Please hold.","voice":"cedar"}