Code Llama 是 Meta 专门用于代码生成和理解的开放权重模型系列。它建立在 Llama 2 基础之上,带有额外的特定代码训练,以 7B、13B、34B 和 70B 的大小提供基础、指令和专注于 Python 的变体。Code Llama 通过 Ollama 在本地运行,并支持补全、填充和基于聊天的编码工作流。
开发者
Meta
许可证
Llama Community License
最适合
代码生成和补全
Askimo 不仅仅是一个聊天界面。它是一个完整的编码工作区,将 Code Llama 作为一流的提供商 —— 基于您的代码库进行 RAG、代码块执行和多步骤编码计划。
专为 macOS、Windows 和 Linux 打造的真正桌面应用。快速、响应灵敏,无需浏览器或服务器即可完全离线工作。
无缝的模型选择、端点配置和切换。有关完整详细信息,请参阅 Ollama 提供商设置指南。
使用 Apache Lucene + jvector 索引您的项目文件、PDFs 和文档。模型基于您自己的知识库回答问题。
使用可视化界面进行日常工作,使用 Askimo CLI 进行脚本编写和自动化。相同的提供商配置,无缝切换。
一键将多个提示链接到自动化的工作流中(研究、总结、写作)。无需在窗口之间复制粘贴。
所有的对话和文件都保留在您的设备上。没有遥测,没有云同步,没有数据收集。了解更多关于 Askimo 的安全信息。
通过 Askimo 运行 Code Llama 不到 5 分钟。
在您的终端中运行 ollama pull codellama(或 codellama:34b 以获得更高质量)。
启动 Askimo App 并选择 Ollama 作为您的提供商。将端点设置为 http://localhost:11434。
从模型列表中选择 Code Llama。使用 RAG 索引您的项目文件以获得具有上下文意识的答案,或者使用代码块执行来立即运行生成的代码。
CLI 示例:
askimo --provider ollama --model codellama -p "Write a Python function to parse JSON" 对 2026 年在本地运行 Code Llama 的三种最常见方法进行的公平功能比较。
| 功能 | Askimo App | Ollama CLI | Open WebUI |
|---|---|---|---|
| 可视化聊天界面 | |||
| RAG(与您自己的文件对话) | |||
| 多提供商支持(Ollama + 云) | |||
| 对话历史记录与搜索 | |||
| 开源(OSI 批准的许可证) | |||
| 完全在本地运行模型(100% 隐私) | |||
| 原生桌面应用(无需服务器或浏览器) | |||
| 完全离线工作(无服务器进程) | |||
| 用于脚本编写的 CLI 界面 | |||
| 本地代码块执行(Python、Bash) | |||
| MCP 工具(文件、git、网络、APIs) | 部分支持 | ||
| AI Plans(链式多步提示) | |||
| 服务器端流水线 / 自动化 | 团队版(即将推出) | ||
| 多用户 / 团队功能 | 团队版(即将推出) | ||
| 网页浏览器访问(无需安装应用) |
复选标记 = 包含 · x = 不可用 · 文本 = 部分支持。基于截至 2026 年的公开文档功能。Open WebUI 使用专有许可证(非 OSI 开源)。Ollama CLI 是开源的(MIT)。
受益于私密本地 AI 编码助手的真实编码工作流。
将专有代码粘贴到 Askimo 中,并让 Code Llama 审查其错误、样式问题和安全问题 —— 而无需向任何云服务发送哪怕一行代码。
使用 Askimo RAG 索引您的整个项目目录。向 Code Llama 提出关于您的代码库的问题,并获得基于您实际代码的答案,完全离线。
构建 AI Plans 来链接 Code Llama 提示:分析需求、生成代码、编写测试并生成文档 —— 所有这些都在一次自动化运行中完成。
关于使用桌面 GUI 在本地运行 Code Llama 的常见问题。
Askimo App 是 2026 年针对 Code Llama 功能最全的桌面客户端。它提供适用于 macOS、Windows 和 Linux 的原生应用程序,具有基于您的代码库的本地 RAG、代码块执行、用于多步骤编码工作流的 AI Plans,以及在 Code Llama 和如 Claude 或 GPT 等云编码模型之间切换的能力 —— 所有都在一个应用程序中。
Code Llama 专门为代码生成和补全而构建,对广泛的语言提供了出色的支持。在 2026 年的许多基准测试中,DeepSeek-Coder 往往优于 Code Llama。两者都是极好的选择 —— Askimo 允许您同时运行两者,并按每次对话进行切换,以利用每个模型的优势。
是的。Askimo 内置的 RAG 使用 Apache Lucene 和 jvector 索引您的项目目录。然后 Code Llama 可以回答有关您的代码库的问题、建议改进并生成与您现有模式一致的代码 —— 完全离线。
Code Llama 7B 速度很快,并且可以在大多数硬件上运行。13B 提供了良好的质量/速度平衡。34B 提供了最佳结果,但需要 24GB+ 的 RAM。70B 模型可以媲美闭源质量,但需要高端硬件。使用 Ollama 拉取后,所有尺寸都会出现在 Askimo 中。
是的。Code Llama 通过 Ollama 100% 在本地运行。Askimo 没有添加云同步或遥测。您的源代码、查询和生成的输出永远不会离开您的机器。这使其成为专有代码库和具有严格数据安全策略的公司的理想选择。
免费 • 开源 • 隐私优先 • 离线工作