Skip to main content
全网优质资源汇总✨

Search: #LLM

  1. 📱 🔁 Google AI Edge Gallery

    📦 端侧AI | 本地模型 | 离线生成式AI平台


    ➤ Google AI Edge 官方生成式 AI 体验平台
    ➤ 支持设备端运行大型语言模型(LLM
    ➤ 完全离线运行,数据不上传云端
    ➤ 提供 Gemma 系列模型支持(如 Gemma 4)
    ➤ 面向移动设备优化(Android / iOS)
    ➤ 支持本地推理与低延迟生成
    ➤ 用于测试与评估端侧 AI 能力
    ➤ 支持多模型切换与实验性功能
    ➤ 强调隐私保护与本地计算


    🌐 GitHub:
    https://github.com/google-ai-edge/gallery

    📌 简单说:
    👉 Google AI Edge Gallery 是一个用于在手机或本地设备上运行大模型的官方平台,可以离线体验生成式 AI(如 Gemma),主打隐私、本地推理和低延迟 AI 体验。

    📂 #GoogleAI #EdgeAI #Gemma #本地模型 #LLM
    📁 AI平台
  2. 🤖 🔁 GLM-4.7 Flash Uncensored

    📦 本地模型 | GGUF格式 | 开源LLM


    ➤ 基于 GLM-4.7 的本地语言模型版本
    ➤ GGUF 格式,适配本地推理工具
    ➤ 支持个人电脑离线运行
    ➤ 面向创意写作与编程辅助场景
    ➤ 轻量化设计,降低运行门槛
    ➤ 可在本地模型框架中加载使用
    ➤ 来自 Zhipu AI 系列模型衍生版本
    ➤ 提供更开放的生成能力体验


    📥 下载:
    https://huggingface.co/DavidAU/GLM-4.7-Flash-Uncensored-Heretic-NEO-CODE-Imatrix-MAX-GGUF

    📌 简单说:
    👉 这是一个 GLM-4.7 的 GGUF 本地模型版本,可以在个人电脑上运行,用于编程辅助与文本生成,强调本地部署与自由生成能力。

    📂 #GLM #本地模型 #GGUF #LLM #AI模型
    📁 AI模型
  3. 🧠 🔁 CanIRun.ai

    📦 本地AI检测 | 模型兼容性 | 硬件分析工具


    ➤ 通过浏览器自动检测本地硬件配置
    ➤ 分析 CPU / GPU / VRAM / 内存等关键指标
    ➤ 判断可运行的本地 AI 模型
    ➤ 支持 Llama、Qwen、Mistral、DeepSeek 等模型
    ➤ 显示模型运行等级(可运行 / 勉强运行 / 不支持)
    ➤ 基于 WebGPU / WebGL 等浏览器能力实现
    ➤ 无需安装软件,无需注册账号
    ➤ 纯前端运行,数据不上传服务器
    ➤ 适合本地部署 LLM 前的硬件评估


    🌐 官网:
    https://www.canirun.ai/

    📌 简单说:
    👉 CanIRun.ai 是一个“AI 版 Can I Run It”工具,打开网页即可自动检测你的电脑硬件,并告诉你哪些大模型可以在本地运行、运行效果如何,帮助你在下载或部署本地模型前做出判断。

    ⚙️ 特点:
    • 自动识别 GPU 与显存
    • 模型兼容性评分系统
    • 支持主流开源大模型库
    • 完全浏览器运行(隐私友好)
    • 零安装、即开即用

    📂 #CanIRunAI #本地模型 #LLM #AI工具 #硬件检测
    📁 AI工具
  4. 🧠 🔁 LM Studio Models

    📦 本地大模型 | GGUF模型库 | AI模型下载


    ➤ 本地运行 AI 模型
    ➤ 一键下载 GGUF 模型
    ➤ 支持聊天、编程、视觉模型
    ➤ 兼容 Windows / macOS / Linux
    ➤ 无需云端,数据本地处理
    ➤ 持续更新热门开源模型


    🌐 模型库:
    https://lmstudio.ai/models

    📌 简单说:
    👉 LM Studio Models 是 LM Studio 官方模型目录,收录了大量可本地运行的开源 AI 模型,可以直接下载并在 LM Studio 中使用,无需依赖云端服务。 :contentReference[oaicite:0]{index=0}

    🔥 热门模型:
    • Qwen 3 / Qwen 3.6
    • Qwen3-Coder
    • Qwen3-Coder-Next
    • Gemma 4
    • DeepSeek-R1
    • GPT-OSS
    • GLM-4.7
    • Devstral
    • MiniMax M2
    • Nemotron 系列

    💻 适用场景:
    👉 AI聊天
    👉 代码生成
    👉 图像理解
    👉 文档分析
    👉 Agent工作流
    👉 本地知识库

    🔒 优势:
    所有模型均可在本地电脑运行,数据无需上传云端,更适合隐私敏感场景。

    📂 #LMStudio #LocalAI #LLM #GGUF #开源模型
    📁 AI工具
  5. 🔁 Free LLM API Resources
    📦 免费AI接口 | API资源合集 | 开发者工具


    ➤ 免费API资源|收录可用的大模型接口
    ➤ 多模型支持|GPT、Claude、Gemini、DeepSeek 等
    ➤ 持续更新|定期整理最新可用资源
    ➤ 开发测试|适合学习与项目验证
    ➤ 开源维护|GitHub 社区协作更新
    ➤ 快速接入|提供接口与使用说明


    🌐 GitHub:
    https://github.com/cheahjs/free-llm-api-resources

    📌 简单说:
    👉 一个收集免费 LLM API、AI 模型接口和开发资源的开源项目,涵盖 GPT、Claude、Gemini、DeepSeek 等热门模型,方便开发者快速测试和集成 AI 能力。

    ⚠️ 注意:
    • 免费接口可能随时失效或限流
    • 不建议用于生产环境
    • 更适合学习、测试和原型开发

    📂 #API #LLM #AI开发 #开发者资源
    📁 开发工具 / AI资源
  6. 🔁 Free LLM API Keys
    📦 免费AI接口 | LLM API Keys | 开发者资源


    ➤ 免费API Keys|收集可用的大模型接口密钥
    ➤ 多模型支持|GPT、Claude、Gemini、DeepSeek、Grok 等
    ➤ OpenAI兼容|支持 OpenAI SDK 调用方式
    ➤ 持续更新|公开密钥定期更新与替换
    ➤ 开发测试|适合学习、实验与原型开发
    ➤ 开源项目|GitHub 免费获取


    🌐 GitHub:
    https://github.com/alistaitsacle/free-llm-api-keys/blob/main/README_CN.md

    📌 简单说:
    👉 一个开源项目,整理并分享可用于测试的大模型 API Keys,涵盖 GPT、Claude、Gemini、DeepSeek 等热门模型,支持 OpenAI 兼容接口,方便开发者快速体验和开发 AI 应用。

    ⚠️ 注意:
    • 公共 Key 可能随时失效或额度耗尽
    • 不适合生产环境使用
    • 建议仅用于学习、测试和原型验证

    📂 #API #LLM #GPT #Claude #Gemini #DeepSeek
    📁 开发者工具 / AI资源
  7. 🔁 MiniMind
    📦 从零训练LLM | 小参数大模型 | AI学习项目


    ➤ 从0训练|2小时即可训练超小型 LLM
    ➤ 轻量模型|最低仅 64M 参数规模
    ➤ 完整链路|支持 Pretrain / SFT / RLHF / LoRA
    ➤ 多模态扩展|包含视觉与 Omni 模型
    ➤ 兼容生态|支持 transformers / ollama / vllm
    ➤ 学习友好|适合大模型原理与训练实践


    🌐 GitHub:
    https://github.com/jingyaogong/minimind

    📌 简单说:
    👉 一个超热门的大模型学习项目,主打“从零训练自己的 LLM”,用极低成本快速理解大模型训练全流程。适合 AI 学习、研究与个人复现。

    ———— 商务合作————

    📂 #LLM #大模型 #AI训练 #机器学习
    📁 Windows / AI工具
  8. 🔁 Awesome LLM Apps
    📦 AI应用合集 | LLM项目 | 开源案例库


    ➤ AI项目合集|收录大量 LLM 应用案例
    ➤ 多领域覆盖|聊天 / Agent / RAG / 语音 / 图像
    ➤ 开源即用|附带完整源码与部署方式
    ➤ 多模型兼容|支持 OpenAI / Claude / Gemini 等
    ➤ 学习参考|适合开发者快速搭建 AI 项目
    ➤ 持续更新|热门 AI App 持续收录


    🌐 项目地址:
    https://www.zdoc.app/zh/Shubhamsaboo/awesome-llm-apps

    📌 简单说:
    👉 一个收录各种 AI / LLM 开源应用的项目导航库,非常适合找灵感与学习参考。

    ———— 商务合作————

    📂 #LLM #AIAgent #开源项目 #AI应用
    📁 Windows / 开发工具
  9. 🔥 AI 圈大地震!3.5GB 模型性能干翻 Claude、Gemini?!🔥

    忘掉那些几十上百 GB 的庞然大物吧!一款名为 VibeThinker 的离线模型,正在颠覆我们对“强大”的认知!

    🚀 为什么说它是“核弹”?
    性能逆天: 在多项基准测试中,击败了 Claude, Gemini, Qwen, DeepSeek 等所有顶级模型!
    体积小到离谱: 整个模型只有 3.5 GB,比一部电影还小!
    你的电脑就能跑: 无需顶级显卡,普通电脑甚至个人服务器就能轻松运行。
    全能选手: 写代码、写文章、逻辑推理... 样样精通。

    这可能是实现“人人都能本地运行超强 AI”的第一步。

    → 前往 GitHub 探索项目
    → 前往 Hugging Face 下载模型

    频道 | 💬 群组 | 📬 投稿 | 📨 商务

    #AI #开源 #LLM #本地模型 #黑科技
  10. #LLM 一个轻量级、支持全链路且易于二次开发的大模型应用项目 基于 Dify 、Ollama&Vllm、Sanic 和 Text2SQL 等技术构建的一站式大模型应用开发项目,采用 Vue3、TypeScript 和 Vite 5 打造现代UI。具备处理 CSV 文件 📂 表格问答的能力。同时,能方便对接第三方开源 RAG 系统 检索系统 🌐
    https://github.com/apconw/sanic-web GitHub - apconw/Aix-DB: Aix-DB 基于 LangChain/LangGraph 框架,结合 MCP Skills 多智能体协作架构,实现自然语言到数据洞察的端到端转换。
  11. #翻译 #LLM 使用大模型技术全自动翻译视频的Agent,本项目利用LLM Agent的反思机制,通过校验翻译结果控制翻译的时长,实现音视频的自动同步和高质量翻译。
    经过实测,项目目前能够实现中文到英文、法文、葡萄牙文、西班牙文、德文、俄语的自动翻译,以及英文到法文、葡萄牙文、西班牙文、德文、俄语的自动翻译,其他语言暂未测试。
    https://github.com/caixikai/tiktokwit?tab=readme-ov-file
  12. #LLM #AI Agenter Daily News Collector 是一个基于开源 LLM 的自动新闻收集工作流程展示项目,由 Agently AI 应用程序开发框架提供支持。
    您可以使用此项目生成几乎任何新闻收集主题。您需要做的就是简单地输入新闻收藏的字段主题。然后你等待,人工智能代理将自动完成他们的工作,直到生成高质量的新闻集合并保存到一个MD文件中。
    https://github.com/AgentEra/Agently-Daily-News-Collector GitHub - AgentEra/Agently-Daily-News-Collector: An open-source LLM based automatically daily news collecting workflow showcase…
  13. #自动化 #LLM
    Unstract 是一个开源的无代码平台,可让您自动化任何规模的文档处理工作流程。Unstract 利用尖端的 AI 超越了 IDP(智能文档处理)和 RPA(机器人流程自动化)的当前功能
    官网:https://unstract.com
    Github:https://github.com/Zipstack/unstract
    使用Unstract,您可以实现机器对机器的自动化。你可以启动API,接收复杂的文档并返回结构化的JSON,所有这些都使用简单的无代码方法。您还可以启动非结构化数据 ETL 管道,它可以从各种云文件/对象存储系统中读取复杂文档,并将结构化数据写入常用的数据仓库和数据库。
    步骤
    第 1 步:将文档添加到无代码 Prompt Studio 并执行提示工程以提取必填字段 第 2 步:将 Prompt Studio 项目配置为 API 部署或为 ETL Pipeline 配置输入源和输出目标 第 3 步:将工作流部署为非结构化数据 API 或非结构化数据 ETL Pipelines!
    📡发布:https://noisevip.cn/18237.html
    🪧关注频道:@quanshoulu
    💬频道社群:https://www.noisework.cn/qun/
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn
  14. #AI #LLM
    Flyflow一行代码即可解锁低延迟可微调LLM模型
    介绍
    Flyflow是在2024年3月推出的一项针对模型微调API集成的一项服务,Flyflow 是中间件,旨在针对所有LLM的响应、延迟、安全性等进行优化,构建为开源、用 golang 编写的高性能,以及可选的自托管以实现最大的灵活性。
    ⚠️:截止本文发送时间该服务处于早期运行阶段
    官网:https://flyflow.dev
    GITHUB:https://github.com/flyflow-devs/flyflow
    特征
    Flyflow 使用 openai 自动跟踪您的查询模式,您可以使用它来微调 mixtral MoE 或 llama 70b,以匹配查询模式上 GPT4 的质量。
    推理
    Flyflow 通过在许多不同的推理提供程序之间进行负载均衡,可以大幅提高令牌限制和可靠性。
    使用 anyscale、together.ai 和 fal 等提供商托管您的自定义精细模型,并使用与 GPT4 相同的质量水平来优化延迟、令牌/秒和速率限制。
    这也实现了更高的可靠性,因为如果提供商发生故障,我们可以放弃回退来接载负载。
    安全性和可观测性
    Flyflow 还可以充当安全中间件,防止敏感信息到达推理提供者(包括 openai 和 microsoft)。
    提供易于配置的插件,允许您从查询中过滤 PII,以及帮助您了解组织如何使用 LLM 的高级可观测性工具。
    可配置性
    Flyflow 被设计为具有极强的可配置性。后端是用 golang 编写的,旨在最大限度地提高性能,同时不影响开发人员的灵活性。
    API端点可用模型
    Model Name | API String | Context Length…
    📡发布:https://noisevip.cn/17989.html
    📢关注频道:@quanshoulu
    💬频道社群:https://www.noisework.cn/qun/
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn
  15. #LLM
    Klu-LLM协作优化应用程序
    Klu是一个用于协作处理提示、评估和优化LLM驱动的应用程序,可加快原型完成、助手和工作流。跟踪更改并集成到您的产品开发工作流程中。Klu 与您首选的模型提供程序集成,并连接来自不同来源的数据,为您的应用程序提供独特的上下文。它提供了对 Anthropic Claude 2 和 OpenAI GPT-4 等 LLM 的统一 API 访问,使开发人员能够快速测试提示工程和性能
    官网:https://klu.ai
    📡发布:https://noisevip.cn/17920.html
    📢关注频道:@quanshoulu
    💬频道社群:https://www.noisework.cn/qun/
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn
  16. #AI #LLM
    开源LLM工程平台
    介绍
    Langfuse 是一个开源的 LLM 工程平台,可帮助团队协作调试、分析和迭代其 LLM 应用程序。
    官网:https://langfuse.com![1709893206894](https://jsd.onmicrosoft.cn/gh/rcy1314/tuchuang@main/uPic/1709893206894.png)
    核心平台功能
    发展
    - **可观察性:**检测应用并开始将跟踪引入到 Langfuse(快速入门、跟踪
    )
    ◦ 跟踪应用中的所有 LLM 调用和所有其他相关逻辑
    ◦ 适用于 Python 和 JS/TS 的异步 SDK,以及应用程序接口(在新选项卡中打开)
    ◦ OpenAI SDK、Langchain、LlamaIndex、LiteLLM、Flowise 和 Langflow 的集成
    - **Langfuse 用户界面:**检查和调试复杂的日志和用户会话(演示、跟踪、会话))
    - **提示:**在 Langfuse 中管理、版本控制和部署提示(提示管理)
    -

    监控

    - **分析学:**跟踪指标(LLM 成本、延迟、质量)并从仪表板和数据导出(分析)中获得见解)
    - **评估:**收集和计算你的LLM完成的分数(分数和评估
    )
    ◦ 运行基于模型的评估
    ◦ 收集用户反馈
    ◦ 在 Langfuse 中手动对观测值进行评分
    演示
    📡发布:https://noisevip.cn/17787.html
    📢关注频道:@quanshoulu
    💬频道社群:https://www.noisework.cn/qun/
    📬投稿bot:@noisewowbot
    📇搜索bot:@Efficiencysearchbot
    🎁访问主页: www.noisework.cn