Microsoft Phi là một dòng mô hình ngôn ngữ nhỏ nhưng vượt xa hạng cân của chúng. Được thiết kế để chạy hiệu quả trên các phần cứng phổ thông, các mô hình Phi cung cấp chất lượng suy luận ấn tượng dù ở kích thước rất nhỏ gọn.
Askimo App mang đến cho Phi một không gian làm việc desktop hoàn chỉnh: lịch sử trò chuyện được lưu trữ, tìm kiếm tệp tin cục bộ (RAG), các AI Plans nhiều bước, tích hợp các công cụ MCP và chuyển đổi mượt mà giữa Phi cùng các nhà cung cấp cloud, tất cả trong một ứng dụng native siêu nhẹ.
Phi là dòng mô hình ngôn ngữ nhỏ (SLMs) của Microsoft Research, trải dài từ Phi-1 đến Phi-4. Mặc dù có kích thước nhỏ, các mô hình Phi liên tục đánh bại những mô hình lớn hơn nhiều trong các bài kiểm tra (benchmarks) suy luận và lập trình nhờ dữ liệu huấn luyện chất lượng cao. Chúng chạy cực kỳ nhanh trên phần cứng phổ thông thông qua Ollama, khiến chúng trở nên lý tưởng cho các tình huống ngoại tuyến và edge computing.
Nhà phát triển
Microsoft
Giấy phép
MIT
Tốt nhất cho
Suy luận siêu nhẹ trên mọi phần cứng
Askimo không phải là một lớp bọc (wrapper) đơn giản. Đây là một không gian làm việc AI cục bộ hoàn chỉnh cho phép bạn chạy Phi riêng tư với tốc độ tối đa đồng thời có quyền truy cập vào các mô hình cloud khi bạn cần đến chúng.
Được xây dựng như một ứng dụng desktop thực sự cho macOS, Windows và Linux. Nhanh chóng, phản hồi tốt và hoạt động hoàn toàn ngoại tuyến không cần trình duyệt hay máy chủ.
Lựa chọn mô hình, cấu hình endpoint và chuyển đổi liền mạch. Xem hướng dẫn thiết lập nhà cung cấp Ollama để biết thông tin chi tiết.
Lập chỉ mục các tệp dự án, PDFs và tài liệu của bạn với Apache Lucene + jvector. Mô hình trả lời các câu hỏi dựa trên cơ sở kiến thức của riêng bạn.
Sử dụng giao diện trực quan cho công việc hàng ngày và Askimo CLI để viết kịch bản và tự động hóa. Cùng một cấu hình nhà cung cấp, chuyển đổi liền mạch.
Liên kết nhiều prompt thành các quy trình tự động (nghiên cứu, tóm tắt, viết) chỉ bằng một cú nhấp chuột. Không cần sao chép-dán giữa các cửa sổ.
Tất cả các cuộc trò chuyện và tệp đều lưu trên thiết bị của bạn. Không có đo lường từ xa, không đồng bộ hóa đám mây, không thu thập dữ liệu. Tìm hiểu thêm về bảo mật Askimo.
Việc chạy Phi qua Askimo chỉ mất chưa tới 5 phút.
Tải xuống và chạy Ollama trên máy của bạn. Hệ thống sẽ xử lý việc tải và phục vụ mô hình.
Chạy ollama pull phi4 (hoặc phiên bản Phi bạn thích) trong terminal của bạn.
Khởi chạy Askimo App và chọn Ollama làm nhà cung cấp. Đặt endpoint thành http://localhost:11434.
Chọn Phi từ danh sách mô hình và bắt đầu trò chuyện. Việc suy luận nhanh chóng khiến nó trở nên hoàn hảo cho các câu trả lời nhanh, đánh giá mã (code review) và các truy vấn RAG theo thời gian thực.
Ví dụ CLI:
askimo --provider ollama --model phi4 -p "Review this code for bugs" Bảng so sánh tính năng công bằng của ba cách phổ biến nhất để chạy Phi cục bộ vào năm 2026.
| Tính năng | Askimo App | Ollama CLI | Open WebUI |
|---|---|---|---|
| Giao diện chat trực quan | |||
| RAG (chat với tệp của riêng bạn) | |||
| Hỗ trợ đa nhà cung cấp (Ollama + cloud) | |||
| Lịch sử trò chuyện và tìm kiếm | |||
| Mã nguồn mở (giấy phép được OSI phê duyệt) | |||
| Chạy các mô hình hoàn toàn cục bộ (riêng tư 100%) | |||
| Ứng dụng desktop gốc (không có máy chủ hoặc trình duyệt) | |||
| Hoạt động hoàn toàn ngoại tuyến (không có quy trình máy chủ) | |||
| Giao diện CLI để viết mã | |||
| Thực thi khối mã cục bộ (Python, Bash) | |||
| Các công cụ MCP (tệp, git, web, APIs) | Một phần | ||
| AI Plans (các prompt nối tiếp nhiều bước) | |||
| Quy trình máy chủ / tự động hóa | Phiên bản Team (sắp ra mắt) | ||
| Các tính năng đa người dùng / nhóm | Phiên bản Team (sắp ra mắt) | ||
| Truy cập qua trình duyệt web (không cài đặt ứng dụng) |
dấu kiểm = bao gồm · x = không khả dụng · văn bản = hỗ trợ một phần. Dựa trên các tính năng được tài liệu hóa công khai tính đến năm 2026. Open WebUI sử dụng giấy phép độc quyền (không phải nguồn mở OSI). Ollama CLI là nguồn mở (MIT).
Các workflows thực tế hưởng lợi từ việc chạy Phi trong một không gian làm việc desktop hoàn chỉnh.
Kích thước siêu nhỏ của Phi mang lại phản hồi nhanh như chớp ngay cả trên các thiết bị MacBook cũ hay những cỗ máy không có GPU. Lịch sử được lưu trữ của Askimo giúp xây dựng ngữ cảnh (context) qua từng phiên làm việc.
Dù kích thước nhỏ, Phi mang lại sự hỗ trợ lập trình rất mạnh mẽ. Sử dụng tính năng thực thi khối mã của Askimo để tạo, chạy và lặp mã mà không cần rời khỏi ứng dụng.
Phi chạy hoàn toàn ngoại tuyến và không cần kết nối internet. Hoàn hảo cho các môi trường bảo mật, công việc yêu cầu tính cơ mật hoặc đơn giản là muốn duy trì sự riêng tư toàn diện cho dữ liệu.
Những câu hỏi phổ biến về việc chạy Microsoft Phi cục bộ bằng GUI trên desktop.
Askimo App là ứng dụng client trên desktop sở hữu nhiều tính năng nhất cho Microsoft Phi vào năm 2026. Ứng dụng cung cấp phiên bản native cho macOS, Windows và Linux với RAG cục bộ, công cụ MCP, AI Plans, lịch sử trò chuyện được lưu trữ và khả năng chuyển đổi nhiều nhà cung cấp, tất cả trong khi vẫn giữ dữ liệu của bạn hoàn toàn ngoại tuyến.
Các mô hình Phi nhỏ hơn đáng kể (3B–14B tham số) nhưng được huấn luyện bằng dữ liệu có chất lượng cực cao, cho phép chúng sánh ngang hoặc vượt trội hơn các mô hình lớn hơn trong nhiều tác vụ suy luận. Chúng chạy nhanh hơn nhiều và sử dụng ít RAM hơn, trở nên lý tưởng cho các công việc hàng ngày trên mọi phần cứng.
Phi-4 (14B) là phiên bản mới nhất và có khả năng nhất. Phi-3.5 Mini là lựa chọn tuyệt vời cho các phần cứng cũ hoặc khi bạn cần tốc độ tối đa. Tất cả các phiên bản sẽ xuất hiện trong bộ chọn mô hình của Askimo sau khi được tải về bằng Ollama.
Có. Khi đã được tải về bằng Ollama, Phi chạy hoàn toàn trên máy của bạn mà không cần kết nối internet. Askimo hoạt động hoàn toàn ngoại tuyến, điều này giúp Phi trở thành lựa chọn tuyệt vời cho các môi trường bảo mật hoặc air-gapped.
Có. Các mô hình Phi được phát hành dưới giấy phép MIT, giúp chúng hoàn toàn mở cho việc nghiên cứu, sử dụng cho mục đích thương mại và sửa đổi. Đây là một trong những giấy phép cho phép nhiều quyền nhất trong số các dòng mô hình AI hiện đại.
Các bước hướng dẫn chi tiết để kết nối Ollama với Askimo App.
Chạy cục bộ mô hình Phi-4 mới nhất của Microsoft với Ollama và Askimo App.
Chạy cục bộ các mô hình Llama của Meta với Ollama và Askimo App.
So sánh Askimo, LM Studio và Open WebUI cho việc chạy Ollama cục bộ.
Miễn phí • Nguồn mở • Ưu tiên quyền riêng tư • Hoạt động ngoại tuyến