Skip to main content
🎉 Efficiency资源干货全收录

Search: #语音AI

  1. 🔁 Voicebox
    📦 AI语音工具 | 本地语音转文字 | 开源项目


    ➤ 语音转文字|支持本地离线 ASR 识别
    ➤ 多模型支持|兼容 Whisper / Faster-Whisper
    ➤ 音频转录|支持 MP3 / WAV / M4A 等格式
    ➤ 字幕生成|自动生成 SRT 字幕文件
    ➤ 本地运行|注重隐私 无需上传云端
    ➤ 开源免费|跨平台桌面应用



    🌐 项目地址:
    https://github.com/jamiepine/voicebox

    📌 简单说:
    👉 一个开源的本地 AI 转录工具,可快速把音频视频转换成字幕与文本。

    ———— 商务合作————

    📂 #AI工具 #语音转文字 #Whisper #开源项目
    📁 Windows / AI工具
    ❤️ 3 👍 1
  2. 🔁 VibeVoice
    📦 开源项目 | GitHub | AI语音生成 + 识别


    ➤ 长音频识别|支持最长60分钟语音转文字(ASR)
    ➤ 结构化转录|自动识别说话人 + 时间戳 + 内容
    ➤ 多人语音生成|支持最多4人对话语音(TTS)
    ➤ 超长语音|可生成最长约90分钟连续音频
    ➤ 实时语音|支持低延迟流式TTS输出
    ➤ 多语言支持|覆盖50+语言识别能力
    ➤ 开源研究|适合开发与语音AI实验


    🌐 项目:
    https://github.com/microsoft/VibeVoice

    ———— 商务合作————

    📂 #AI工具 #语音AI #开源项目 #TTS #ASR
    📁 Windows / 开发工具
    ❤️ 8
  3. 🎨 TryVoice - AI Agent 的免提语音运行环境
    解放双手 · 像聊天一样与 AI 编程助手对话

    📌 工具介绍:

    TryVoice 为 AI Agent(如 Claude Code、OpenClaw)提供了一层语音交互外壳。它支持唤醒词激活、实时流式响应及中断播放,让用户无需触碰键盘即可通过语音操控 AI 编程助手,实现真正的“动口不动手”。


    ⚡️ 核心特点:

    🛠 唤醒词激活:支持 OpenWakeWord,说出关键词即可开启对话。
    🔍 实时流式响应:边生成边播放,支持随时打断,交互体验极佳。
    ⚙️ 广泛适配:内置 Claude Code 与 OpenClaw 适配器,支持 SDK 扩展。


    🌐 项目地址:
    https://github‍.com/AaronZ021/tryvoice-oss

    #TryVoice #AIAgent #语音交互 #ClaudeCode #OpenClaw #开源项目 #效率工具
    ❤️ 1
  4. 🎙 悟声 AI:超拟真 AI 语音合成与瞬时克隆平台
    全球领先模型 · 极速声音克隆 · 创作有声内容
    📌 项目介绍:

    悟声 AI 是音频人工智能领域的先驱者,提供极度自然的 AI 语音克隆与配音合成技术。其 V3.1 大模型在世界权威语音模型盲测排行榜中名列前茅,致力于模糊真实与虚拟声音的边界。

    ⚙️ 核心亮点:

    拟真合成:支持多语种(中/英/日/韩/粤等)超拟真语音生成。
    瞬时克隆:仅需少量音频样本即可快速克隆任何角色声音。
    音色转换:支持将一段音频的音色完美转换为目标角色的声音。
    声音市场:内置丰富的社区与专业声音库,一键调用。
    开放平台:提供强大的 API 接口,支持开发者集成音频应用。

    🌐 资源链接:

    • 官方网站:https://www.wusound.cn/


    📢 频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #AI配音 #语音克隆 #AI工具 #音频合成 #悟声AI
    ❤️ 5
  5. 短视频工厂

    一个开源的桌面端应用,旨在通过AI技术简化短视频的制作流程。用户可以通过简单的提示词文本+视频分镜素材,快速且自动的剪辑出高质量的产品营销和泛内容短视频。该项目集成了AI驱动的文案生成、语音合成、视频剪辑、字幕特效等功能,旨在为用户提供开箱即用的短视频制作体验。

    点击访问

    #电脑软件 #短视频工厂 #AI短视频 #自动剪辑 #批量生成 #文案生成 #语音合成 #开源
    ❤️ 3
  6. 💥 GitHub 爆火开源项目|90 分钟超长语音一口气合成
    推荐:开源即登顶的 AI 语音合成项目,程序员圈讨论度极高。

    🟢 项目核心亮点:


    超长语音合成: 🗣 一次性合成最长约 90 分钟音频
    AI 语音自然: 🎧 语调流畅,适合播客 / 有声书 / 长文本
    开源即爆火: ⭐️ GitHub 上线后迅速登顶热门
    程序员友好: 💻 适合二次开发与自动化集成
    多场景适用: 📚 有声内容制作、旁白、配音等


    长文本语音合成场景下,非常有潜力的开源方案。

    🌐 项目链接:
    ❤️ 点击直达

    频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #AI #语音合成 #程序员 #GitHub #Soul
    ❤️ 4 👍 1
  7. 🟠 RealDubbing - 在线文本转语音神器

    🟢 简介:
    一款免费的文本转语音工具,能生成自然流畅的音频,让内容创作变得轻松搞定。

    核心功能:
    海量声音选择: 提供上百种 AI 声音供你选择。
    高度自定义: 可以自定义生成的语音的语速和音高。
    AI 对话生成: 还支持 AI 对话生成功能。
    完全免费: 无需注册,即可无限次生成高品质语音。
    全球语言覆盖: 支持全球多种语言。

    🌐 网站地址:
    点击此处,立即访问

    频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #语音转换 #网站 #TTS #AI工具
    ❤️ 2