OpenAudio S1 – Fish Audio推出的新一代语音生成模型-AI下载

OpenAudio S1 – Fish Audio推出的新一代语音生成模型

作者：AI下载发布时间：2025-07-19

OpenAudio S1是什么

OpenAudio S1是Fish Audio推出的文本转语音（TTS）模型，基于超过200万小时的音频数据训练，支持13种语言。采用双自回归（Dual-AR）架构和强化学习与人类反馈（RLHF）技术，生成的声音高度自然、流畅，几乎与人类配音无异。模型支持超过50种情感和语调标记，用户可通过自然语言指令灵活调整语音表达。OpenAudio S1支持零样本和少样本语音克隆，仅需10到30秒的音频样本可生成高保真的克隆声音。

OpenAudio S1的主要功能

高度自然的语音输出：基于超过 200 万小时的音频数据训练，生成的语音几乎与人类配音无异，适用于视频配音、播客和游戏角色语音等专业场景。

MoonCast – 零样本AI播客生成系统，合成自然的播客风格

Gemini Fullstack LangGraph Quickstart – 谷歌DeepMind开源的全栈AI研究助手

DecipherIt – AI研究助手，支持多源研究整合和分析

Qwen3 Embedding – 阿里通义开源的文本嵌入模型系列

Qwen3 Reranker – 阿里通义开源的文本重排序模型

Eleven v3 – ElevenLabs推出的AI文本转语音模型

MiniCPM 4.0 – 面壁智能开源极致高效的端侧大模型

dots.llm1 – 小红书hi lab开源的文本大模型

MonkeyOCR – 华中科技联合金山办公推出的文档解析模型