Skip to main content
🎉 Efficiency资源干货全收录

🔁 VibeVoice📦 开源项目 | GitHub | AI语音生成 + 识别➤ 长音频识别|支持最长60分钟语音转文字(ASR)➤ 结构化转录|自动识别说话人 + 时间戳 + 内容➤ 多人语音生成|支持最多4人对话语音(TTS)➤ 超长语音|可生成最长约90分钟连续音频➤ 实时语音|支持低延迟流式TTS输出➤ 多语言支持|覆盖50+语言识别能力➤ 开源研究|适合开发与语音AI实验🌐 项目:

  1. 🔁 VibeVoice
    📦 开源项目 | GitHub | AI语音生成 + 识别


    ➤ 长音频识别|支持最长60分钟语音转文字(ASR)
    ➤ 结构化转录|自动识别说话人 + 时间戳 + 内容
    ➤ 多人语音生成|支持最多4人对话语音(TTS)
    ➤ 超长语音|可生成最长约90分钟连续音频
    ➤ 实时语音|支持低延迟流式TTS输出
    ➤ 多语言支持|覆盖50+语言识别能力
    ➤ 开源研究|适合开发与语音AI实验


    🌐 项目:
    https://github.com/microsoft/VibeVoice

    ———— 商务合作————

    📂 #AI工具 #语音AI #开源项目 #TTS #ASR
    📁 Windows / 开发工具
    ❤️ 8