LLaVA (Large Language and Vision Assistant) bringt multimodale KI — die Fähigkeit, Bilder zu verstehen und zu diskutieren — über Ollama auf Ihren lokalen Computer. Es eröffnet eine völlig neue Klasse von KI-Workflows jenseits von Text.
Die Askimo App bietet LLaVA einen vollständigen Desktop-Arbeitsbereich: dauerhaften Chat-Verlauf, lokale Dateisuche (RAG), mehrstufige AI Plans, MCP-Tool-Integrationen und die Möglichkeit, Vision-Aufgaben mit Cloud-Anbietern zu kombinieren, alles in einer nativen App.
LLaVA ist ein quelloffenes, multimodales großes Sprachmodell, das einen Vision-Encoder mit einem Sprachmodell-Backbone kombiniert, um Bilder zu verstehen und darüber nachzudenken. Ursprünglich von Forschern der University of Wisconsin-Madison und Microsoft Research entwickelt, ist LLaVA frei verfügbar und läuft lokal über Ollama, wodurch Vision-KI-Funktionen auf Verbraucherhardware gebracht werden.
Entwickler
University of Wisconsin-Madison / Microsoft Research
Lizenz
Apache 2.0
Am besten für
Multimodales Bildverständnis
Askimo ist kein dünner Wrapper. Es ist ein vollständiger lokaler KI-Arbeitsbereich, mit dem Sie die Vision-Funktionen von LLaVA mit RAG, Workflows und dem Wechsel zwischen mehreren Anbietern kombinieren können.
Entwickelt als echte Desktop-App für macOS, Windows und Linux. Schnell, reaktionsschnell und funktioniert vollständig offline ohne erforderlichen Browser oder Server.
Nahtlose Modellauswahl, Endpunktkonfiguration und Wechsel. Weitere Details finden Sie im Ollama-Anbieter-Einrichtungsleitfaden.
Indizieren Sie Ihre Projektdateien, PDFs und Dokumente mit Apache Lucene + jvector. Das Modell beantwortet Fragen basierend auf Ihrer eigenen Wissensdatenbank.
Nutzen Sie die visuelle Oberfläche für die tägliche Arbeit und die Askimo CLI für Skripting und Automatisierung. Gleiche Anbieterkonfiguration, nahtloser Wechsel.
Verketten Sie mehrere Prompts mit einem Klick zu automatisierten Workflows (Recherchieren, Zusammenfassen, Schreiben). Kein Kopieren und Einfügen zwischen Fenstern.
Alle Gespräche und Dateien bleiben auf Ihrem Gerät. Keine Telemetrie, keine Cloud-Synchronisierung, keine Datenerfassung. Erfahren Sie mehr über die Sicherheit von Askimo.
Das Ausführen von LLaVA über Askimo dauert weniger als 5 Minuten.
Laden Sie Ollama herunter und führen Sie es auf Ihrem Computer aus. Es kümmert sich um Modell-Downloads und das Bereitstellen.
Führen Sie ollama pull llava in Ihrem Terminal aus.
Starten Sie die Askimo App und wählen Sie Ollama als Ihren Anbieter. Setzen Sie den Endpunkt auf http://localhost:11434.
Wählen Sie LLaVA aus der Modellliste und beginnen Sie, Vision-KI lokal zu nutzen. Kombinieren Sie es mit RAG, um Dokumente zu indizieren und fundierte, bildbezogene Antworten zu erhalten.
CLI-Beispiel:
askimo --provider ollama --model llava -p "What is in this image?" Ein fairer Funktionsvergleich der drei gängigsten Möglichkeiten, LLaVA im Jahr 2026 lokal auszuführen.
| Funktion | Askimo App | Ollama CLI | Open WebUI |
|---|---|---|---|
| Visuelle Chat-Schnittstelle | |||
| RAG (Chat mit Ihren eigenen Dateien) | |||
| Multi-Provider-Unterstützung (Ollama + Cloud) | |||
| Gesprächsverlauf und Suche | |||
| Open Source (OSI-zertifizierte Lizenz) | |||
| Modelle vollständig lokal ausführen (100% privat) | |||
| Native Desktop-App (kein Server oder Browser) | |||
| Funktioniert vollständig offline (kein Serverprozess) | |||
| CLI-Schnittstelle für Skripting | |||
| Lokale Codeblock-Ausführung (Python, Bash) | |||
| MCP-Tools (Datei, git, Web, APIs) | Teilweise | ||
| AI Plans (verkettete mehrstufige Prompts) | |||
| Serverseitige Pipelines / Automatisierung | Team-Edition (demnächst) | ||
| Mehrbenutzer- / Team-Funktionen | Team-Edition (demnächst) | ||
| Webbrowser-Zugriff (keine App-Installation) |
Häkchen = enthalten · x = nicht verfügbar · Text = teilweise Unterstützung. Basierend auf öffentlich dokumentierten Funktionen Stand 2026. Open WebUI verwendet eine proprietäre Lizenz (nicht OSI Open Source). Ollama CLI ist Open Source (MIT).
Echte Workflows, die davon profitieren, multimodale KI lokal auszuführen.
Analysieren Sie Screenshots, Produktfotos, Diagramme und gescannte Dokumente, ohne etwas an eine Cloud-Vision-API zu senden. Alles bleibt auf Ihrem Computer.
Kombinieren Sie LLaVA mit Askimo RAG, um Fragen zu bildlastigen PDFs, technischen Diagrammen und visuellen Berichten komplett offline zu stellen.
Nutzen Sie AI Plans, um die Bildanalyse mit der Textgenerierung zu verketten. Beschreiben Sie ein Bild, fassen Sie Ergebnisse zusammen und entwerfen Sie dann einen Bericht — alles automatisiert in einem Plan.
Häufige Fragen zur lokalen Ausführung von LLaVA mit einer Desktop-GUI.
Die Askimo App ist der funktionsreichste Desktop-Client für LLaVA im Jahr 2026. Sie bietet eine native App für macOS, Windows und Linux mit lokalem RAG, MCP-Tools, AI Plans, dauerhaftem Chat-Verlauf und Wechsel zwischen Anbietern — und das alles, während Ihre Bilder und Daten vollständig offline bleiben.
LLaVA kann Bilder beschreiben, Fragen zu Fotos und Screenshots beantworten, Diagramme analysieren, Text in Bildern lesen (im OCR-Stil), Objekte und Szenen identifizieren und visuelle Inhalte in natürlicher Sprache begründen.
LLaVA, das lokal über Ollama läuft, ist etwas weniger leistungsfähig als das neueste GPT-4 Vision oder Gemini Vision, aber es ist kostenlos, völlig privat und läuft offline. Für die meisten Dokumenten- und Bildanalyseaufgaben ist es mehr als ausreichend.
Ja, LLaVA kann auf Bildern sichtbaren Text mit angemessener Genauigkeit lesen und transkribieren. Für schwere OCR-Arbeitslasten ist ein dediziertes OCR-Tool möglicherweise besser, aber zum Lesen von Etiketten, Captchas, Screenshots und Dokumentenscans funktioniert LLaVA gut.
Ja. LLaVA läuft vollständig auf Ihrem Computer über Ollama. Ihre Fotos werden nirgendwo hochgeladen. Askimo fügt keine Cloud-Synchronisierung oder Telemetrie hinzu, sodass Ihre Bilder völlig privat bleiben.
Schritt-für-Schritt-Anleitung zur Verbindung von Ollama mit der Askimo App.
Führen Sie die Llama-Modelle von Meta lokal mit Ollama und der Askimo App aus.
Führen Sie die Gemma-Modelle von Google lokal mit Ollama und der Askimo App aus.
Vergleichen Sie Askimo, LM Studio und Open WebUI zum lokalen Ausführen von Ollama.
Kostenlos • Open Source • Datenschutz zuerst • Funktioniert offline