Gemma 是 Google 的开放权重语言模型系列,建立在 Gemini 相同的研究和技术基础之上。在宽松的许可下发布用于研究和商业用途,Gemma 模型紧凑、高效,专为通过 Ollama 在消费级硬件上良好运行而设计。
开发者
许可证
Gemma 使用条款
最适合
本地 Google 质量的 AI
Askimo 不是一个简单的封装。它是一个本地 AI 工作区,允许您私下运行 Gemma,同时在需要完整的云模型时也可以切换到 Google Gemini API。
专为 macOS、Windows 和 Linux 打造的真正桌面应用。快速、响应灵敏,无需浏览器或服务器即可完全离线工作。
无缝的模型选择、端点配置和切换。有关完整详细信息,请参阅 Ollama 提供商设置指南。
使用 Apache Lucene + jvector 索引您的项目文件、PDFs 和文档。模型基于您自己的知识库回答问题。
使用可视化界面进行日常工作,使用 Askimo CLI 进行脚本编写和自动化。相同的提供商配置,无缝切换。
一键将多个提示链接到自动化的工作流中(研究、总结、写作)。无需在窗口之间复制粘贴。
所有的对话和文件都保留在您的设备上。没有遥测,没有云同步,没有数据收集。了解更多关于 Askimo 的安全信息。
通过 Askimo 运行 Gemma 不到 5 分钟。
在您的终端中运行 ollama pull gemma3。
启动 Askimo App 并选择 Ollama 作为您的提供商。将端点设置为 http://localhost:11434。
从模型列表中选择 Gemma。在本地聊天,使用 RAG 索引您的文档,或在需要完整的云模型时切换到 Gemini API 提供商。
CLI 示例:
askimo --provider ollama --model gemma3 -p "简单解释这个概念" 2026 年在本地运行 Gemma 的三种最常见方式的公平功能比较。
| 功能 | Askimo App | Ollama CLI | Open WebUI |
|---|---|---|---|
| 可视化聊天界面 | |||
| RAG(与您自己的文件对话) | |||
| 多提供商支持(Ollama + 云) | |||
| 对话历史记录与搜索 | |||
| 开源(OSI 批准的许可证) | |||
| 完全在本地运行模型(100% 隐私) | |||
| 原生桌面应用(无需服务器或浏览器) | |||
| 完全离线工作(无服务器进程) | |||
| 用于脚本编写的 CLI 界面 | |||
| 本地代码块执行(Python、Bash) | |||
| MCP 工具(文件、git、网络、APIs) | 部分支持 | ||
| AI Plans(链式多步提示) | |||
| 服务器端流水线 / 自动化 | 团队版(即将推出) | ||
| 多用户 / 团队功能 | 团队版(即将推出) | ||
| 网页浏览器访问(无需安装应用) |
复选标记 = 包含 · x = 不可用 · 文本 = 部分支持。基于截至 2026 年的公开文档功能。Open WebUI 使用专有许可证(非 OSI 开源)。Ollama CLI 是开源的(MIT)。
在完整的桌面工作区中运行 Gemma 而受益的实际工作流。
在本地使用 Gemma 执行敏感任务,然后在需要完整的云模型时在 Askimo 中切换到 Google Gemini API。同一个应用,相同的聊天记录,不同的隐私级别。
使用 Askimo RAG 索引 PDF、报告和笔记。就您自己的文档向 Gemma 提问,而无需向 Google 发送任何内容。一切都在您的机器上。
Gemma 强大的安全调整和清晰的解释使其非常适合研究和教育。将问题链接到 AI 计划中,逐步探索主题。
关于使用桌面 GUI 在本地运行 Gemma 的常见问题。
Askimo App 是 2026 年 Gemma 功能最全的桌面客户端。它提供了一个适用于 macOS、Windows 和 Linux 的原生应用,具有本地 RAG、MCP 工具、AI 计划、持久聊天记录,以及在同一个应用中在本地 Gemma (通过 Ollama) 和 Google Gemini API 之间切换的独特能力。
Gemini 是 Google 的旗舰云 AI 模型,通过 API 提供。Gemma 是您可以下载并在本地运行的开放权重版本。Gemma 基于类似的研究构建,但体积更小,专为设备端使用而设计。使用 Askimo,您可以两者兼得:通过 Ollama 在本地使用 Gemma,通过 API 使用 Gemini,并在每次对话中进行切换。
是的。一旦您使用 Ollama 拉取了 Gemma 模型,它就完全在您的机器上运行,不需要互联网连接。Askimo 在此模式下完全离线工作。
Gemma 2B 可以在几乎任何机器上运行,包括较旧的 MacBook 和没有 GPU 的机器。Gemma 9B 为大多数硬件提供了质量和速度的良好平衡。Gemma 27B 提供最佳质量,但需要更多 RAM。一旦用 Ollama 拉取,所有尺寸都会出现在 Askimo 的模型选择器中。
是的。Askimo 支持 Ollama (用于本地 Gemma) 和 Google Gemini API 提供商。您可以在每次对话中切换它们。无论您使用哪个提供商,您的本地 RAG 上下文都可用。
免费 • 开源 • 隐私优先 • 离线工作