当前位置:首页 > OpenAudio S1 – Fish Audio推出的新一代语音生成模型
OpenAudio S1 – Fish Audio推出的新一代语音生成模型
作者:AI下载 发布时间:2025-07-19

OpenAudio S1是什么

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双自回归(Dual-AR)架构和强化学习与人类反馈(RLHF)技术,生成的声音高度自然、流畅,几乎与人类配音无异。模型支持超过50种情感和语调标记,用户可通过自然语言指令灵活调整语音表达。OpenAudio S1支持零样本和少样本语音克隆,仅需10到30秒的音频样本可生成高保真的克隆声音。

OpenAudio S1的主要功能

高度自然的语音输出:基于超过 200 万小时的音频数据训练,生成的语音几乎与人类配音无异,适用于视频配音、播客和游戏角色语音等专业场景。