Gemma của Google mang nghiên cứu đằng sau Gemini đến các mô hình mở mà bạn có thể chạy hoàn toàn trên phần cứng của riêng mình. Hầu hết người dùng truy cập nó thông qua trình duyệt hoặc terminal và không bao giờ khai thác hết tiềm năng của nó.
Ứng dụng Askimo cung cấp cho Gemma một không gian làm việc desktop hoàn chỉnh: lịch sử trò chuyện lưu trữ, tìm kiếm tệp cục bộ (RAG), Kế hoạch AI nhiều bước, tích hợp công cụ MCP và chuyển đổi mượt mà giữa Gemma và Google Gemini API hoặc các nhà cung cấp đám mây khác, tất cả mà không cần rời khỏi ứng dụng.
Gemma là gia đình mô hình ngôn ngữ mở của Google, được xây dựng trên cùng một nghiên cứu và công nghệ đằng sau Gemini. Được phát hành cho mục đích nghiên cứu và thương mại theo một giấy phép cho phép, các mô hình Gemma nhỏ gọn, hiệu quả và được thiết kế để chạy tốt trên phần cứng tiêu dùng thông qua Ollama.
Nhà phát triển
Giấy phép
Điều khoản sử dụng Gemma
Tốt nhất cho
AI chất lượng của Google cục bộ
Askimo không phải là một lớp bọc mỏng. Đó là một không gian làm việc AI cục bộ cho phép bạn chạy Gemma một cách riêng tư trong khi vẫn chuyển đổi sang Google Gemini API khi bạn cần toàn bộ mô hình đám mây.
Được xây dựng như một ứng dụng desktop thực sự cho macOS, Windows và Linux. Nhanh chóng, phản hồi tốt và hoạt động hoàn toàn ngoại tuyến không cần trình duyệt hay máy chủ.
Lựa chọn mô hình, cấu hình endpoint và chuyển đổi liền mạch. Xem hướng dẫn thiết lập nhà cung cấp Ollama để biết thông tin chi tiết.
Lập chỉ mục các tệp dự án, PDFs và tài liệu của bạn với Apache Lucene + jvector. Mô hình trả lời các câu hỏi dựa trên cơ sở kiến thức của riêng bạn.
Sử dụng giao diện trực quan cho công việc hàng ngày và Askimo CLI để viết kịch bản và tự động hóa. Cùng một cấu hình nhà cung cấp, chuyển đổi liền mạch.
Liên kết nhiều prompt thành các quy trình tự động (nghiên cứu, tóm tắt, viết) chỉ bằng một cú nhấp chuột. Không cần sao chép-dán giữa các cửa sổ.
Tất cả các cuộc trò chuyện và tệp đều lưu trên thiết bị của bạn. Không có đo lường từ xa, không đồng bộ hóa đám mây, không thu thập dữ liệu. Tìm hiểu thêm về bảo mật Askimo.
Chạy Gemma thông qua Askimo mất chưa đến 5 phút.
Tải xuống và chạy Ollama trên máy tính của bạn. Nó xử lý việc tải xuống và cung cấp mô hình.
Chạy ollama pull gemma3 trong terminal của bạn.
Khởi chạy Ứng dụng Askimo và chọn Ollama làm nhà cung cấp của bạn. Đặt endpoint thành http://localhost:11434.
Chọn Gemma từ danh sách mô hình. Trò chuyện cục bộ, lập chỉ mục tài liệu của bạn bằng RAG, hoặc chuyển sang nhà cung cấp Gemini API khi bạn cần toàn bộ mô hình đám mây.
Ví dụ CLI:
askimo --provider ollama --model gemma3 -p "Giải thích khái niệm này một cách đơn giản" Một sự so sánh tính năng công bằng của ba cách phổ biến nhất để chạy Gemma cục bộ vào năm 2026.
| Tính năng | Askimo App | Ollama CLI | Open WebUI |
|---|---|---|---|
| Giao diện chat trực quan | |||
| RAG (chat với tệp của riêng bạn) | |||
| Hỗ trợ đa nhà cung cấp (Ollama + cloud) | |||
| Lịch sử trò chuyện và tìm kiếm | |||
| Mã nguồn mở (giấy phép được OSI phê duyệt) | |||
| Chạy các mô hình hoàn toàn cục bộ (riêng tư 100%) | |||
| Ứng dụng desktop gốc (không có máy chủ hoặc trình duyệt) | |||
| Hoạt động hoàn toàn ngoại tuyến (không có quy trình máy chủ) | |||
| Giao diện CLI để viết mã | |||
| Thực thi khối mã cục bộ (Python, Bash) | |||
| Các công cụ MCP (tệp, git, web, APIs) | Một phần | ||
| AI Plans (các prompt nối tiếp nhiều bước) | |||
| Quy trình máy chủ / tự động hóa | Phiên bản Team (sắp ra mắt) | ||
| Các tính năng đa người dùng / nhóm | Phiên bản Team (sắp ra mắt) | ||
| Truy cập qua trình duyệt web (không cài đặt ứng dụng) |
dấu kiểm = bao gồm · x = không khả dụng · văn bản = hỗ trợ một phần. Dựa trên các tính năng được tài liệu hóa công khai tính đến năm 2026. Open WebUI sử dụng giấy phép độc quyền (không phải nguồn mở OSI). Ollama CLI là nguồn mở (MIT).
Các luồng công việc thực tế được hưởng lợi từ việc chạy Gemma trong một không gian làm việc desktop hoàn chỉnh.
Sử dụng Gemma cục bộ cho các tác vụ nhạy cảm, sau đó chuyển sang Google Gemini API trong Askimo khi bạn cần toàn bộ mô hình đám mây. Cùng một ứng dụng, cùng một lịch sử trò chuyện, mức độ riêng tư khác nhau.
Lập chỉ mục PDF, báo cáo và ghi chú với Askimo RAG. Đặt câu hỏi cho Gemma về tài liệu của riêng bạn mà không cần gửi bất cứ thứ gì cho Google. Mọi thứ đều ở trên máy tính của bạn.
Việc tinh chỉnh an toàn mạnh mẽ và giải thích rõ ràng của Gemma khiến nó trở nên lý tưởng cho nghiên cứu và giáo dục. Liên kết các câu hỏi vào Kế hoạch AI để khám phá các chủ đề từng bước.
Các câu hỏi phổ biến về việc chạy Gemma cục bộ với một GUI desktop.
Ứng dụng Askimo là máy khách desktop đầy đủ tính năng nhất cho Gemma vào năm 2026. Nó cung cấp một ứng dụng nguyên bản cho macOS, Windows và Linux với RAG cục bộ, công cụ MCP, Kế hoạch AI, lịch sử trò chuyện lưu trữ lâu dài và khả năng duy nhất để chuyển đổi giữa Gemma cục bộ (qua Ollama) và Google Gemini API, tất cả trong cùng một ứng dụng.
Gemini là mô hình AI đám mây hàng đầu của Google, có sẵn thông qua API. Gemma là phiên bản mở mà bạn có thể tải xuống và chạy cục bộ. Gemma được xây dựng trên nghiên cứu tương tự nhưng nhỏ hơn và được thiết kế để sử dụng trên thiết bị. Với Askimo, bạn có thể sử dụng cả hai: Gemma cục bộ qua Ollama và Gemini qua API, và chuyển đổi giữa chúng theo từng cuộc trò chuyện.
Có. Sau khi bạn kéo mô hình Gemma bằng Ollama, nó chạy hoàn toàn trên máy tính của bạn mà không cần kết nối internet. Askimo hoạt động hoàn toàn ngoại tuyến trong chế độ này.
Gemma 2B chạy trên hầu hết mọi máy tính bao gồm cả các máy MacBook cũ hơn và các máy không có GPU. Gemma 9B cung cấp một sự cân bằng tốt giữa chất lượng và tốc độ cho hầu hết phần cứng. Gemma 27B mang lại chất lượng tốt nhất nhưng yêu cầu nhiều RAM hơn. Tất cả các kích thước đều xuất hiện trong bộ chọn mô hình của Askimo sau khi được tải xuống bằng Ollama.
Có. Askimo hỗ trợ cả Ollama (cho Gemma cục bộ) và nhà cung cấp Google Gemini API. Bạn có thể chuyển đổi giữa chúng theo từng cuộc trò chuyện. Ngữ cảnh RAG cục bộ của bạn luôn có sẵn bất kể bạn sử dụng nhà cung cấp nào.
Hướng dẫn từng bước để kết nối Ollama với Ứng dụng Askimo.
Sử dụng toàn bộ Google Gemini API trong Ứng dụng Askimo.
Chạy Mistral cục bộ với Ollama và Ứng dụng Askimo.
Chạy các mô hình Llama của Meta cục bộ với Ollama và Ứng dụng Askimo.
Miễn phí • Nguồn mở • Ưu tiên quyền riêng tư • Hoạt động ngoại tuyến