Ollama 是什麼?在自己電腦跑 AI 模型的新手入門
編輯:BJ最後檢查:2026-04-27主要來源:GitHub
Ollama 是讓你在自己電腦下載、執行和管理 AI 模型的工具。本文用白話整理它能做什麼、去哪裡下載、要不要錢、電腦需要多強,以及新手第一個模型該怎麼跑。
先抓 Ollama 的角色
- Ollama 是讓你在自己電腦跑 AI 模型的工具,常被用來入門「本機 AI」。
- 它會幫你下載模型、啟動模型,然後讓你用指令或其他工具呼叫模型。
- 最大價值是資料不必送到雲端,但速度和品質很吃電腦硬體。
用這 4 題判斷要不要裝
| 問題 | 白話答案 |
|---|---|
| 可以幹嘛? | 在自己電腦跑 Llama、Gemma、Qwen、DeepSeek 等模型,做摘要、改寫、翻譯、分類、程式輔助。 |
| 去哪裡下載? | 到 Ollama 官方下載頁 https://ollama.com/download,選 Windows、macOS 或 Linux。 |
| 要不要錢? | 本機版下載與使用通常免費;如果使用 Ollama 的雲端模型或其他 API,會有付費方案。 |
| 怎麼開始? | 安裝 Ollama 後,在終端機輸入 ollama run llama3.1:8b,等模型下載完成就能問。 |
Ollama 的一句話定位
Ollama 適合「想把 AI 跑在自己電腦上」的人。它不是另一個 ChatGPT 網站,而是本機模型的啟動器和管理工具。
如果你的資料很敏感,不想傳到雲端,Ollama 很值得試;如果你只想要最聰明、最省事的回答,雲端版 ChatGPT、Gemini、Claude 通常仍然更方便。
Ollama 是什麼?
Ollama 可以想成「AI 模型播放器」。
影片檔需要播放器才能看;AI 模型也需要一個工具才能下載、載入、執行。Ollama 做的就是這件事。
它本身不是模型。真正回答問題的是你下載的模型,例如:
llama3.1:8bgemma3:4bqwen2.5:7bdeepseek-r1
所以「Ollama 聰不聰明」這句話不精準。比較精準的問法是:「我選的模型適不適合這個任務?我的電腦跑不跑得動?」
你可以拿它做什麼?
- 在本機做文件摘要,不把原文傳到雲端。
- 把逐字稿、會議紀錄、客戶問答先做初步整理。
- 做簡單翻譯、改寫、分類、程式碼解釋。
- 搭配 Open WebUI,變成像 ChatGPT 的網頁聊天介面。
- 搭配 Dify,把本機模型接進 AI 應用流程。
- 在沒有網路或網路不穩的環境使用 AI。
比較不適合拿來做高精準法律、醫療、投資、稅務最終判斷。這些任務可以拿它當草稿或輔助,但最後一定要人工確認。
去哪裡下載?
官方下載頁:
https://ollama.com/download支援系統:
- macOS
- Windows
- Linux
- Docker
安裝完後,用終端機或 PowerShell 測試:
ollama run llama3.1:8b第一次會下載模型,檔案可能好幾 GB,請先確認硬碟空間和網路速度。
免費之外還有硬體成本
分兩種看:
- 本機版 Ollama:下載、安裝、在自己電腦跑模型通常不需要月費。
- 雲端或 API 用法:Ollama 官方也有雲端模型與付費方案;其他模型服務商 API 也可能按用量計費。
本機使用看起來免費,但仍有隱性成本:
- 電腦要夠強,可能要升級 RAM 或顯卡。
- 大模型會吃硬碟空間。
- 長時間跑模型會耗電、發熱、變慢。
- 商業使用前要確認模型授權,不是每個模型都可以無條件商用。
我的電腦跑得動嗎?
先用這個簡化版判斷:
| 電腦規格 | 建議模型 | 體感 |
|---|---|---|
| 8GB RAM | 3B 小模型 | 可測試,不適合重度使用 |
| 16GB RAM | 7B / 8B 模型 | 新手最常見起點 |
| 32GB RAM 或 RTX 4070 以上 | 14B / 32B 模型 | 品質和速度比較可用 |
| 64GB RAM 或高階顯卡 | 70B 模型 | 專業測試,但仍會慢 |
新手建議先跑小一點的模型,不要一開始就追最大。跑得動、知道怎麼用,比模型參數大更重要。
新手怎麼開始?
最短路徑如下:
- 到官方下載頁安裝 Ollama。
- 打開終端機或 PowerShell。
- 輸入:
ollama run llama3.1:8b- 等模型下載完成。
- 看到
>>>後直接輸入問題。
如果你的電腦比較舊,可以改試:
ollama run llama3.2:3b常用指令:
ollama list
ollama pull gemma3:4b
ollama run qwen2.5:7b誰適合從本機模型開始
- 不想把文件、客戶資料、研究資料傳到雲端的人。
- 想學本機 AI,但不想一開始就研究複雜框架的人。
- 需要離線環境的老師、研究室、工程團隊。
- 想搭配 Open WebUI 做本機聊天介面的人。
- 願意接受本機模型品質不一定贏雲端模型的人。
哪些情況用雲端更省事
- 電腦很舊、硬碟空間很少的人。
- 完全不想碰終端機的人。
- 追求最強回答品質、最穩定速度的人。
- 不願意查模型授權、用途限制的人。
本機模型的風險
- 本機不等於零風險:如果你把 Ollama 服務開到區網或公網,仍然可能被別人連進來。
- 不要直接開到公網:Ollama 預設是本機連線,請不要隨便改成外網可連。
- 模型會亂答:開源模型仍會編造答案,重要內容要查證。
- 授權要確認:Llama、Gemma、Qwen、DeepSeek 等模型授權不同,商業使用前要看模型卡。
- 中文品質不一致:同一個問題,不同模型的繁中能力差很多。
- 敏感資料仍要去識別化:本機跑也建議先把姓名、電話、身分證、客戶名稱遮掉。
其他本機與雲端選擇
- LM Studio:桌面圖形介面,比 Ollama 更適合完全不想打指令的人。
- [Open WebUI](/articles/github-tools/open-webui):常搭配 Ollama,提供網頁聊天介面。
- ChatGPT / Gemini / Claude:最省事,回答品質通常更好,但資料在平台端處理。
- llama.cpp:更底層、更可調,但新手門檻高。
最後該不該從 Ollama 開始
如果你只是想知道「本機 AI 能不能用」,先裝 Ollama,跑一個 3B 或 8B 模型,拿非敏感資料測 30 分鐘。
如果你覺得命令列太難用,再加 Open WebUI。如果你想把本機模型做成客服、問答或流程工具,再研究 Dify。
不要一開始就買高階顯卡。先確認你真的需要「資料不出電腦」這件事,再決定要不要投入硬體成本。
參考來源
- Ollama GitHub:https://github.com/ollama/ollama
- Ollama Download:https://ollama.com/download
- Ollama Model Library:https://ollama.com/library
- Ollama Pricing:https://ollama.com/pricing
- Hugging Face Model Cards:https://huggingface.co/
最後檢查日期:2026-04-27
延伸閱讀
Open WebUI 是一個可自架的 AI 聊天網頁介面,可以連接本機 Ollama 模型或 OpenAI、Anthropic、Google 等雲端 API。本文用白話整理它能做什麼、去哪裡安裝、要不要錢、適合誰使用,以及新手第一步怎麼開始。
LM Studio 是什麼?Windows 上不打指令就能跑本機 AI 的桌面工具LM Studio 是 Windows、Mac、Linux 都能用的桌面 AI 模型工具,全程點選介面、免打指令,下載完模型就能本機聊天。這篇用新手角度說明它能幹嘛、怎麼裝、要不要錢、電腦規格夠不夠、跟 Ollama 與 Jan 怎麼選。
Continue.dev 是什麼?不被綁定模型廠商的 VS Code AI 寫程式外掛Continue.dev 是 VS Code 與 JetBrains 上的開源 AI 寫程式外掛,可以聊天、補全、改 code、跑 agent,還能接 ChatGPT、Claude、Gemini 或本機 Ollama。這篇用新手角度說明它能幹嘛、跟 Cursor 與 Cline 差在哪、要不要錢。
LibreChat 是什麼?一個介面同時接 ChatGPT、Claude、Gemini 的自架聊天工具LibreChat 是開源自架的 AI 聊天介面,畫面像 ChatGPT 但可以同時接 ChatGPT、Claude、Gemini、本機 Ollama,省下三套訂閱費。這篇用新手角度說明它能幹嘛、跟 Open WebUI 差在哪、怎麼開始用、要不要錢。
Whisper 是什麼?OpenAI 開源的本機語音轉文字工具新手指南Whisper 是 OpenAI 開源、可離線本機跑的語音轉文字工具,可以把錄音、會議、Podcast、影片字幕轉成文字檔,不用上傳雲端。這篇用新手角度說明它能幹嘛、怎麼裝、中文準不準、要不要錢。
Dify 是什麼?把 AI 做成客服、問答、流程應用的平台Dify 是一個把 AI 做成可發布應用的平台,可以做客服機器人、文件問答、工作流程和內部助理。本文用白話整理它能做什麼、去哪裡使用、雲端與自架差別、要不要錢,以及新手怎麼開始。