AI 工具雷達
GitHub 與進階 AI 工具新手難度:Docker:通常不用來源:GitHub7 分鐘閱讀

Open Interpreter 是什麼?用講話叫電腦做事的開源 AI 助手

編輯:BJ最後檢查:2026-06-01主要來源:GitHub

Open Interpreter 是 GitHub 上 6 萬顆星的開源工具,讓你用自然語言叫電腦寫 code、改檔案、整理資料、轉檔。這篇用新手角度說明它能幹嘛、怎麼安全試、跟 ChatGPT Code Interpreter、Cursor 差在哪。

Open Interpreter 從自然語言指令到本機執行程式碼前需要人工確認的安全流程圖
自製示意圖:Open Interpreter 的重點不是能不能做事,而是執行前要不要讓它碰你的真實電腦。

Open Interpreter 想解決什麼問題

很多日常雜事其實寫個小腳本就能做。「把這資料夾的 50 張 png 壓成 webp」、「把這個 csv 依日期排序」、「合併這 10 個 PDF 的第一頁」 — 但你每次都要自己想語法、查命令、貼到 PowerShell 跑一次。

Open Interpreter 想把這一步省掉。打開終端機輸入 interpreter直接用中文或英文講你要什麼。它幫你寫 code、問你要不要跑、按 y 才在你電腦上執行。

它跟 ChatGPT 內建的 Code Interpreter 差別很大。那個跑在 OpenAI 雲端、有檔案大小限制、看不到你電腦本機的檔案。Open Interpreter 跑在你自己電腦,能直接動你的檔案。

重要警告先講:它會在你本機執行 AI 寫的程式碼,這比一般聊天 AI 危險。第一次玩一定要在不重要的資料夾、用不重要的檔案測試,不要直接拿它操作你的工作檔。

它怎麼運作?三件事要先知道

流程很簡單:

  1. 你用中文或英文描述任務,例如「幫我把桌面上所有 .heic 轉成 .jpg」。
  2. AI 寫一段 Python 或 shell code 來做這件事。
  3. 它把 code 顯示在終端機,問你 Run this code? (y/n),你按 y 才執行。

按 y 之後跑完,AI 會回報結果。

如果你不喜歡每次都按 y,可以加 -y 參數讓它自動跑。但這個選項對新手非常危險,建議先不要用。

它能幹嘛?

實際使用情境(都用講的):

  • 把這資料夾的 50 張 png 壓成 webp,品質 80。
  • 找出我下載資料夾超過 100MB 的影片,列檔名和大小。
  • 把這個 csv 依日期排序存新檔。
  • 合併這資料夾裡所有 txt 成一個 markdown,加檔名當標題。
  • 看這個 json 有幾種不同的 status 值。
  • 把這 10 個 PDF 各自第一頁抓出來合併成一個檔。
  • 寫一個 Python 把這資料夾的圖片改名成日期加流水號。

它不適合做的事:

  • 高風險操作(改系統設定、刪檔、git 強制 push),這種務必自己手動做。
  • 處理機密資料(用 GPT-4o 或 Claude 等於把內容傳到雲端,要本機就接 Ollama)。
  • 即時互動式工作,它是一輪一輪對話,不是 GUI app。

哪裡下載

工具本身免費開源(AGPL-3.0),安裝就一行:

pip install open-interpreter

需要 Python 3.10 以上,Windows、macOS、Linux 都可以。GitHub 在 https://github.com/OpenInterpreter/open-interpreter ,官方文件在 https://docs.openinterpreter.com 。

它會花錢嗎?看你接哪個模型

工具本身免費,費用取決於你接哪個模型:

  1. OpenAI GPT-4o(預設):要去 OpenAI 申請 API key,按 token 付費,日常輕量使用通常一天幾塊台幣以內。
  2. Anthropic Claude:自帶 API key,按用量付費。
  3. 本機 Ollama / LM Studio / Jan:完全免費,但品質和速度看你電腦規格。
  4. 本機模型對 Open Interpreter 不夠強:官方文件直接提醒「本機模型寫 code 能力比 GPT-4o / Claude 差很多,講話要更明確」。

新手建議:先用 OpenAI 充個 5 美金 API key 試水溫,確認你真的會用、用得上,再考慮本機模型。

我電腦能不能用?

最低門檻:

  • 能裝 Python 3.10+ 的電腦。
  • 接雲端 API(GPT-4o / Claude):電腦本身幾乎沒壓力。
  • 接本機 Ollama:另外要 16GB RAM、最好有獨立顯卡。

如果你電腦能跑 VS Code,Open Interpreter 就裝得起來。

新手怎麼開始(含安全沙箱)

最短路徑:

  1. 確認 Python 3.10+:python --version,沒有的話到 python.org 裝最新版。
  1. 安裝:pip install open-interpreter
  1. 拿 OpenAI API key 設環境變數:
  • Windows PowerShell:$env:OPENAI_API_KEY = "sk-你的-key"
  • Mac / Linux:export OPENAI_API_KEY="sk-你的-key"
  1. 重要:先建一個測試資料夾
   mkdir interpreter-test
   cd interpreter-test

放幾個不重要的檔案進去(複製幾張隨便的圖片、txt),不要在工作資料夾直接玩。

  1. 啟動:interpreter
  1. 開始講話,例如「列出這個資料夾的所有檔案,告訴我各自大小」,它會生 code、顯示出來、問你要不要跑,按 y 才執行。

想用本機 Ollama?先裝 Ollama,然後 interpreter --local,按提示選 Ollama 和你已經 pull 過的模型。

使用上要小心的事(這節請仔細看)

Open Interpreter 是這個分類裡風險最高的工具,因為它會在你電腦本機執行 AI 產生的 code。具體可能踩的雷:

  • AI 寫錯指令會直接動到檔案:你說「整理資料夾」,它可能解讀成「刪掉看起來重複的檔案」,第一次一定要在測試資料夾玩。
  • `-y` 或 auto_run 模式非常危險:它會跳過確認步驟,新手不要用,老手也只在 100% 確定的場景用。
  • API key 會看到你的指令:你講的話會傳給 OpenAI 或 Claude,要處理機密資料一定要切本機 Ollama。
  • 它能上網、能裝套件、能跑任意指令:如果你不小心給了惡意 prompt(例如貼了某個網路上的指令),它可能跑出你不想要的東西。
  • 不要用 sudo 或 admin 權限跑它:一般使用者權限就好。
  • 備份重要資料:第一次玩之前,把要動的資料夾備份一份。
  • 公司專案要先問:公司資料丟到 GPT-4o 等於傳給 OpenAI,有保密規定要先確認。

新手第一週的安全玩法:

  1. 只在 interpreter-test 之類的測試資料夾玩。
  2. 永遠不開 -y
  3. 每個它生的 code 都看一眼再按 y。
  4. 看不懂的 code 直接按 n,叫它解釋給你聽。

跟其他工具怎麼選

  • 想要完全雲端、不會動本機檔案:用 ChatGPT 內建 Code Interpreter,上傳檔案、OpenAI 雲端跑。
  • 想直接寫或改專案 code:CursorCline 比較順手。
  • 想跑長任務、多步驟 agent:Claude Code 設計就是給這個。
  • 一次性小任務:直接問 ChatGPT「幫我寫一段 PowerShell 做 X」,自己貼上去跑也快。

想開始用 Open Interpreter?

三件事先做,再開始:

  1. 建一個測試資料夾,絕對不要直接在工作目錄玩。
  2. 第一週只用 OpenAI 預設模型,不開 -y,先建立「它會寫對 code 嗎」的直覺。
  3. 每個 code 看一眼再按 y,看不懂就叫它解釋。

如果你只是想「偶爾問 AI 怎麼寫一段指令,自己複製貼上」,不裝 Open Interpreter 也可以,直接用 ChatGPT 就好。Open Interpreter 的價值是「省去複製貼上、直接幫你跑」,這一步同時也是它的風險來源。

下一步可以先看什麼

參考來源

  • Open Interpreter GitHub:https://github.com/OpenInterpreter/open-interpreter
  • 官方文件:https://docs.openinterpreter.com
  • 本機模式文件:https://docs.openinterpreter.com/guides/running-locally

本文最後查證日期:2026-05-20

延伸閱讀

Ollama 是什麼?在自己電腦跑 AI 模型的新手入門

Ollama 是讓你在自己電腦下載、執行和管理 AI 模型的工具。本文用白話整理它能做什麼、去哪裡下載、要不要錢、電腦需要多強,以及新手第一個模型該怎麼跑。

Claude / Codex Skills 是什麼?AI Agent 技能包的功能、限制與新手使用建議

用中文白話整理 Claude / Codex Skills 與 Agent Skills 生態,說明它適合誰、風險在哪、和 MCP、CLAUDE.md、n8n 有什麼差異。

browser-use 是什麼?讓 AI 自己操作瀏覽器的熱門開源工具

browser-use 是熱門的開源瀏覽器自動化工具,主打讓 AI agent 可以看網頁、點按鈕、填表單、完成網站任務。這篇用新手角度說明它好不好上手、適合哪些任務,以及跟 Playwright、Firecrawl 差在哪。

Dify 是什麼?把 AI 做成客服、問答、流程應用的平台

Dify 是一個把 AI 做成可發布應用的平台,可以做客服機器人、文件問答、工作流程和內部助理。本文用白話整理它能做什麼、去哪裡使用、雲端與自架差別、要不要錢,以及新手怎麼開始。

mem0 是什麼?AI 為什麼需要長期記憶?

mem0 是一個給 AI Agent 和 AI 應用使用的記憶層,讓 AI 不只看當下對話,也能記住使用者偏好、歷史互動與任務狀態。本文用白話整理 mem0 可以做什麼、去哪裡用、要不要錢、怎麼開始,以及什麼情境真的需要 AI 長期記憶。

Crawl4AI 是什麼?免費開源、專門把網頁變成餵 AI 資料的爬蟲

Crawl4AI 是 GitHub 上很紅的開源網頁爬蟲,專門把網頁抓下來、轉成乾淨的 Markdown 餵給 AI。這篇用新手角度說明它能幹嘛、跟 Firecrawl 差在哪、要不要錢、什麼人適合用,以及爬網頁前要注意的風險。