LLaVA (Large Language and Vision Assistant) apporte l'IA multimodale — la capacité de comprendre et de discuter d'images — sur votre machine locale via Ollama. Cela ouvre une toute nouvelle classe de flux de travail d'IA au-delà du texte.
Askimo App offre à LLaVA un espace de travail de bureau complet : historique de discussion persistant, recherche de fichiers locaux (RAG), AI Plans en plusieurs étapes, intégrations d'outils MCP et la capacité de combiner des tâches de vision avec des fournisseurs cloud, tout cela dans une application native.
LLaVA est un grand modèle linguistique multimodal open source qui combine un encodeur de vision avec une ossature de modèle linguistique pour comprendre et raisonner sur les images. Développé à l'origine par des chercheurs de la University of Wisconsin-Madison et de Microsoft Research, LLaVA est disponible gratuitement et s'exécute localement via Ollama, apportant les capacités de vision par IA au matériel grand public.
Développeur
University of Wisconsin-Madison / Microsoft Research
Licence
Apache 2.0
Idéal pour
Compréhension multimodale des images
Askimo n'est pas un simple wrapper. C'est un espace de travail d'IA local complet qui vous permet de combiner les capacités de vision de LLaVA avec le RAG, les flux de travail et le basculement multi-fournisseurs.
Conçue comme une véritable application de bureau pour macOS, Windows et Linux. Rapide, réactive et fonctionne entièrement hors ligne sans navigateur ni serveur requis.
Sélection de modèles, configuration des points de terminaison et basculement transparents. Consultez le guide de configuration du fournisseur Ollama pour tous les détails.
Indexez vos fichiers de projet, PDFs et documents avec Apache Lucene + jvector. Le modèle répond aux questions en s'appuyant sur votre propre base de connaissances.
Utilisez l'interface visuelle pour le travail quotidien et l'Askimo CLI pour les scripts et l'automatisation. Même configuration de fournisseur, basculement transparent.
Enchaînez plusieurs prompts dans des flux de travail automatisés (rechercher, résumer, écrire) en un seul clic. Plus de copier-coller entre les fenêtres.
Toutes les conversations et tous les fichiers restent sur votre appareil. Aucune télémétrie, aucune synchronisation cloud, aucune collecte de données. En savoir plus sur la sécurité d'Askimo.
Exécuter LLaVA via Askimo prend moins de 5 minutes.
Téléchargez et exécutez Ollama sur votre machine. Il gère les téléchargements de modèles et le service.
Exécutez ollama pull llava dans votre terminal.
Lancez Askimo App et choisissez Ollama comme fournisseur. Définissez le point de terminaison sur http://localhost:11434.
Sélectionnez LLaVA dans la liste des modèles et commencez à utiliser l'IA de vision localement. Combinez avec le RAG pour indexer des documents et obtenir des réponses fondées, basées sur les images.
Exemple CLI :
askimo --provider ollama --model llava -p "What is in this image?" Une comparaison équitable des fonctionnalités des trois manières les plus courantes d'exécuter LLaVA localement en 2026.
| Fonctionnalité | Askimo App | Ollama CLI | Open WebUI |
|---|---|---|---|
| Interface de chat visuelle | |||
| RAG (discutez avec vos propres fichiers) | |||
| Prise en charge multi-fournisseurs (Ollama + cloud) | |||
| Historique des conversations et recherche | |||
| Open source (licence approuvée par l'OSI) | |||
| Exécution des modèles entièrement en local (100% privé) | |||
| Application de bureau native (sans serveur ni navigateur) | |||
| Fonctionne totalement hors ligne (aucun processus serveur) | |||
| Interface CLI pour les scripts | |||
| Exécution locale de blocs de code (Python, Bash) | |||
| Outils MCP (fichier, git, web, APIs) | Partiel | ||
| AI Plans (prompts enchaînés à plusieurs étapes) | |||
| Pipelines côté serveur / automatisation | Édition équipe (bientôt disponible) | ||
| Fonctionnalités multi-utilisateurs / équipe | Édition équipe (bientôt disponible) | ||
| Accès par navigateur web (aucune installation d'application) |
coche = inclus · x = non disponible · texte = support partiel. Basé sur les fonctionnalités documentées publiquement en 2026. Open WebUI utilise une licence propriétaire (non OSI open source). Ollama CLI est open source (MIT).
Des flux de travail réels qui bénéficient de l'exécution locale de l'IA multimodale.
Analysez des captures d'écran, des photos de produits, des diagrammes et des documents numérisés sans rien envoyer à une API de vision cloud. Tout reste sur votre machine.
Combinez LLaVA avec le RAG Askimo pour poser des questions sur des PDF riches en images, des diagrammes techniques et des rapports visuels, entièrement hors ligne.
Utilisez les AI Plans pour enchaîner l'analyse visuelle avec la génération de texte. Décrivez une image, résumez les résultats, puis rédigez un rapport — le tout automatisé dans un seul plan.
Questions courantes sur l'exécution locale de LLaVA avec une interface graphique de bureau.
Askimo App est le client de bureau le plus complet pour LLaVA en 2026. Il fournit une application native pour macOS, Windows et Linux avec un RAG local, des outils MCP, des AI Plans, un historique de chat persistant et un changement multi-fournisseurs — tout en gardant vos images et données complètement hors ligne.
LLaVA peut décrire des images, répondre à des questions sur des photos et des captures d'écran, analyser des diagrammes, lire le texte dans les images (style OCR), identifier des objets et des scènes, et raisonner sur le contenu visuel en langage naturel.
LLaVA s'exécutant localement via Ollama est légèrement moins performant que les derniers GPT-4 Vision ou Gemini Vision, mais il est gratuit, entièrement privé et fonctionne hors ligne. Pour la plupart des tâches d'analyse de documents et d'images, c'est plus que suffisant.
Oui, LLaVA peut lire et transcrire le texte visible sur les images avec une précision raisonnable. Pour les charges de travail OCR lourdes, un outil OCR dédié peut être meilleur, mais pour lire des étiquettes, des captchas, des captures d'écran et des numérisations de documents, LLaVA fonctionne bien.
Oui. LLaVA s'exécute entièrement sur votre machine via Ollama. Vos photos ne sont jamais envoyées nulle part. Askimo n'ajoute aucune synchronisation cloud ni télémétrie, de sorte que vos images restent complètement privées.
Instructions étape par étape pour connecter Ollama à Askimo App.
Exécutez les modèles Llama de Meta localement avec Ollama et Askimo App.
Exécutez les modèles Gemma de Google localement avec Ollama et Askimo App.
Comparez Askimo, LM Studio et Open WebUI pour exécuter Ollama localmente.
Gratuit • Open Source • Priorité à la confidentialité • Fonctionne hors ligne