📦 开源项目 | GitHub | AI语音生成 + 识别
➤ 长音频识别|支持最长60分钟语音转文字(ASR)
➤ 结构化转录|自动识别说话人 + 时间戳 + 内容
➤ 多人语音生成|支持最多4人对话语音(TTS)
➤ 超长语音|可生成最长约90分钟连续音频
➤ 实时语音|支持低延迟流式TTS输出
➤ 多语言支持|覆盖50+语言识别能力
➤ 开源研究|适合开发与语音AI实验
🌐 项目:
https://github.com/microsoft/VibeVoice
———— 商务合作————
📂 #AI工具 #语音AI #开源项目 #TTS #ASR
📁 Windows / 开发工具
❤️ 8