Gemma von Google bringt die Forschung hinter Gemini in Open-Weight-Modelle, die Sie vollständig auf Ihrer eigenen Hardware ausführen können. Die meisten Benutzer greifen über einen Browser oder ein Terminal darauf zu und schöpfen das volle Potenzial nie aus.
Die Askimo App bietet Gemma einen vollständigen Desktop-Arbeitsbereich: dauerhaften Chat-Verlauf, lokale Dateisuche (RAG), mehrstufige KI-Pläne, MCP-Tool-Integrationen und den nahtlosen Wechsel zwischen Gemma und der Google Gemini API oder anderen Cloud-Anbietern, alles ohne die App zu verlassen.
Gemma ist Googles Familie von Open-Weight-Sprachmodellen, die auf derselben Forschung und Technologie wie Gemini basieren. Die unter einer permissiven Lizenz für Forschung und kommerzielle Nutzung veröffentlichten Gemma-Modelle sind kompakt, effizient und darauf ausgelegt, über Ollama gut auf Consumer-Hardware zu laufen.
Entwickler
Lizenz
Gemma-Nutzungsbedingungen
Am besten für
KI in Google-Qualität lokal
Askimo ist kein einfacher Wrapper. Es ist ein lokaler KI-Arbeitsbereich, der es Ihnen ermöglicht, Gemma privat auszuführen, während Sie auch zur Google Gemini API wechseln können, wenn Sie das vollständige Cloud-Modell benötigen.
Entwickelt als echte Desktop-App für macOS, Windows und Linux. Schnell, reaktionsschnell und funktioniert vollständig offline ohne erforderlichen Browser oder Server.
Nahtlose Modellauswahl, Endpunktkonfiguration und Wechsel. Weitere Details finden Sie im Ollama-Anbieter-Einrichtungsleitfaden.
Indizieren Sie Ihre Projektdateien, PDFs und Dokumente mit Apache Lucene + jvector. Das Modell beantwortet Fragen basierend auf Ihrer eigenen Wissensdatenbank.
Nutzen Sie die visuelle Oberfläche für die tägliche Arbeit und die Askimo CLI für Skripting und Automatisierung. Gleiche Anbieterkonfiguration, nahtloser Wechsel.
Verketten Sie mehrere Prompts mit einem Klick zu automatisierten Workflows (Recherchieren, Zusammenfassen, Schreiben). Kein Kopieren und Einfügen zwischen Fenstern.
Alle Gespräche und Dateien bleiben auf Ihrem Gerät. Keine Telemetrie, keine Cloud-Synchronisierung, keine Datenerfassung. Erfahren Sie mehr über die Sicherheit von Askimo.
Die Ausführung von Gemma über Askimo dauert weniger als 5 Minuten.
Laden Sie Ollama herunter und führen Sie es auf Ihrem Computer aus. Es kümmert sich um Modell-Downloads und das Serving.
Führen Sie ollama pull gemma3 in Ihrem Terminal aus.
Starten Sie die Askimo App und wählen Sie Ollama als Ihren Anbieter. Setzen Sie den Endpunkt auf http://localhost:11434.
Wählen Sie Gemma aus der Modellliste. Chatten Sie lokal, indizieren Sie Ihre Dokumente mit RAG oder wechseln Sie zum Anbieter der Gemini-API, wenn Sie das vollständige Cloud-Modell benötigen.
CLI-Beispiel:
askimo --provider ollama --model gemma3 -p "Erkläre dieses Konzept einfach" Ein fairer Funktionsvergleich der drei häufigsten Methoden, um Gemma im Jahr 2026 lokal auszuführen.
| Funktion | Askimo App | Ollama CLI | Open WebUI |
|---|---|---|---|
| Visuelle Chat-Schnittstelle | |||
| RAG (Chat mit Ihren eigenen Dateien) | |||
| Multi-Provider-Unterstützung (Ollama + Cloud) | |||
| Gesprächsverlauf und Suche | |||
| Open Source (OSI-zertifizierte Lizenz) | |||
| Modelle vollständig lokal ausführen (100% privat) | |||
| Native Desktop-App (kein Server oder Browser) | |||
| Funktioniert vollständig offline (kein Serverprozess) | |||
| CLI-Schnittstelle für Skripting | |||
| Lokale Codeblock-Ausführung (Python, Bash) | |||
| MCP-Tools (Datei, git, Web, APIs) | Teilweise | ||
| AI Plans (verkettete mehrstufige Prompts) | |||
| Serverseitige Pipelines / Automatisierung | Team-Edition (demnächst) | ||
| Mehrbenutzer- / Team-Funktionen | Team-Edition (demnächst) | ||
| Webbrowser-Zugriff (keine App-Installation) |
Häkchen = enthalten · x = nicht verfügbar · Text = teilweise Unterstützung. Basierend auf öffentlich dokumentierten Funktionen Stand 2026. Open WebUI verwendet eine proprietäre Lizenz (nicht OSI Open Source). Ollama CLI ist Open Source (MIT).
Echte Workflows, die davon profitieren, Gemma in einem vollständigen Desktop-Arbeitsbereich auszuführen.
Verwenden Sie Gemma lokal für sensible Aufgaben und wechseln Sie dann in Askimo zur Google Gemini API, wenn Sie das vollständige Cloud-Modell benötigen. Gleiche App, gleicher Chat-Verlauf, unterschiedliches Datenschutzniveau.
Indizieren Sie PDFs, Berichte und Notizen mit Askimo RAG. Stellen Sie Gemma Fragen zu Ihren eigenen Dokumenten, ohne etwas an Google zu senden. Alles bleibt auf Ihrem Computer.
Die starke Sicherheitseinstellung und die klaren Erklärungen von Gemma machen es ideal für Forschung und Bildung. Verketten Sie Fragen zu KI-Plänen, um Themen Schritt für Schritt zu erkunden.
Häufige Fragen zur lokalen Ausführung von Gemma mit einer Desktop-GUI.
Die Askimo App ist 2026 der Desktop-Client für Gemma mit den meisten Funktionen. Sie bietet eine native App für macOS, Windows und Linux mit lokalem RAG, MCP-Tools, KI-Plänen, dauerhaftem Chat-Verlauf und der einzigartigen Fähigkeit, in derselben App zwischen dem lokalen Gemma (über Ollama) und der Google Gemini API zu wechseln.
Gemini ist Googles Flaggschiff-Cloud-KI-Modell, das über eine API verfügbar ist. Gemma ist die Open-Weight-Version, die Sie herunterladen und lokal ausführen können. Gemma basiert auf ähnlichen Forschungen, ist jedoch kleiner und für den Einsatz auf dem Gerät konzipiert. Mit Askimo können Sie beide verwenden: Gemma lokal über Ollama und Gemini über die API, und pro Unterhaltung zwischen ihnen wechseln.
Ja. Sobald Sie das Gemma-Modell mit Ollama heruntergeladen haben, läuft es vollständig auf Ihrem Computer, ohne dass eine Internetverbindung erforderlich ist. Askimo funktioniert in diesem Modus vollständig offline.
Gemma 2B läuft auf fast jedem Computer, einschließlich älterer MacBooks und Computern ohne GPU. Gemma 9B bietet für die meiste Hardware eine gute Balance aus Qualität und Geschwindigkeit. Gemma 27B liefert die beste Qualität, erfordert jedoch mehr RAM. Alle Größen erscheinen im Modellauswähler von Askimo, sobald sie mit Ollama heruntergeladen wurden.
Ja. Askimo unterstützt sowohl Ollama (für das lokale Gemma) als auch den Anbieter der Google Gemini API. Sie können pro Unterhaltung zwischen ihnen wechseln. Ihr lokaler RAG-Kontext ist verfügbar, unabhängig davon, welchen Anbieter Sie verwenden.
Schritt-für-Schritt-Anleitung zur Verbindung von Ollama mit der Askimo App.
Verwenden Sie die vollständige Google Gemini API in der Askimo App.
Führen Sie Mistral lokal mit Ollama und der Askimo App aus.
Führen Sie die Llama-Modelle von Meta lokal mit Ollama und der Askimo App aus.
Kostenlos • Open Source • Datenschutz zuerst • Funktioniert offline