AI 工具雷達
GitHub 與進階 AI 工具新手難度:Docker:視使用方式而定來源:GitHub7 分鐘閱讀

Google ADK 是什麼?用 Python 寫 AI Agent 的官方開發套件

編輯:BJ最後檢查:2026-06-01主要來源:GitHub

Google ADK(Agent Development Kit)是 Google 官方推出的開源 Python 套件,用來寫、測試、部署多代理 AI 系統。這篇用新手角度說明它能幹嘛、跟 LangChain、CrewAI 差在哪、要不要付錢、第一個 agent 怎麼開始。

Google ADK 用 Python 定義 agent、工具、測試與部署流程的示意圖
自製示意圖:Google ADK 比較像給 Python 開發者組 agent 的官方工具箱。

Google ADK 想解決什麼問題

如果你想自己寫 AI agent,不想用拉節點的 n8n、Flowise,也不想學 LangChain 那麼大的框架,Google ADK 是另一條路。它是 Google 官方開源的 Python 套件,主打讓你寫 Python class 定義 agent,用很少程式碼就能組出一個會呼叫工具、有記憶、可以分工合作的 AI 系統。

它預設搭配 Gemini,但也能接 OpenAI、Claude 等其他模型。寫好的 agent 可以本機跑、部署到 Google Cloud(Vertex AI、Cloud Run、GKE),也可以裝進 Docker 跑在別的雲。

費用上,ADK 套件本身免費(Apache 2.0),模型才要錢。Gemini 有免費額度,OpenAI 或 Claude 就按用量付費。

它能幹嘛?四個核心積木

可以想成 Python 版的 agent 樂高,主要四種積木:

  • Agent:一個 AI 角色,有名字、有任務描述、有可用工具清單。
  • Tool:agent 可以呼叫的功能,可以是內建工具(搜尋、Code Interpreter)、你自己寫的 Python 函式、OpenAPI 規格、或 MCP server。
  • Multi-agent:可以讓一個 agent 派任務給其他 agent,做出階層式分工。
  • Session / Memory:對話的記憶與上下文管理,內建有自動摘要、token 追蹤。

寫一個最小 agent 大概 10 多行 Python,跑 adk web 會打開一個本機網頁介面,可以直接跟 agent 聊天、看它呼叫了哪些工具、debug。

哪裡下載

一行裝好:

pip install google-adk

GitHub 在 https://github.com/google/adk-python ,官方文件在 https://google.github.io/adk-docs/ 。需要 Python 3.10 以上,Windows、Mac、Linux 都可以,本機開發完全免費,不用先建 Google Cloud 專案。

除了 Python 版,Google 也有 Java、Go、TypeScript 版,但 Python 版社群最多、文件最完整。

它會花錢嗎?看你接哪個模型、部署在哪

ADK 套件本身免費開源,費用主要在這幾個地方:

  1. Gemini API:Google 提供免費額度,新手日常開發通常夠用,超量按用量付費。
  2. OpenAI / Anthropic / 其他:自帶 API key,按各家用量計費。
  3. Vertex AI Agent Engine:要把 agent 部署到 Google Cloud 的官方 agent 伺服器,會收託管費。
  4. 自己部署 Cloud Run / GKE 或其他雲:照那個雲端服務的費用算,跟 ADK 無關。

新手建議:先用 Gemini 免費額度加本機跑,確認你需要的功能 ADK 做得到,再決定要不要搬上雲。

我電腦能不能跑?

ADK 本身幾乎不吃資源,因為運算都在模型那端(雲端 Gemini API 或本機 Ollama)。最低要求只有 Python 3.10 加一個能上網的電腦。

想接本機模型(如 Ollama),電腦規格再加上 Ollama 自己的需求。

如果電腦能跑 VS Code,就能跑 ADK。

它能拿來做什麼?

幾個常見場景:

  • 客服 agent:能查公司內部 API 的助手。
  • 資料分析助手:先查資料、再算、再產報表的多步驟流程。
  • 監看 agent:定期跑一次,呼叫 API、發 Slack。
  • 多人協作流程:把「研究員 + 寫手 + 編輯」組成一個 agent 小組,自動跑完整篇報告。
  • OpenAPI 接入:把現有 OpenAPI 規格直接丟進去,讓 agent 自己學會呼叫那組 API。

它不適合完全不寫程式的人。如果你不會 Python,去看 Flowisen8n 這類拉節點的工具更合適。

新手怎麼開始

最短路徑:

  1. 建 Python 虛擬環境:python -m venv venv,然後 activate。
  2. 安裝 ADK:pip install google-adk
  3. 到 https://aistudio.google.com 拿一個免費的 Gemini API key,設環境變數 GOOGLE_API_KEY
  4. 開新 agent 專案:adk create my_first_agent
  5. 編輯 agent.py,最簡單範例:
from google.adk.agents import Agent

root_agent = Agent(
    name="my_first_agent",
    model="gemini-2.0-flash",
    instruction="你是一個友善的助手,用繁體中文回答。",
)
  1. 啟動 web 介面測試:adk web,打開瀏覽器到本機測試頁,就能跟 agent 聊天。

下一步可以加自訂工具(Python 函式)、加子 agent 做多代理協作,官方文件都有範例。

跟 LangChain、CrewAI 怎麼選

社群裡幾個常被比較的:

  • LangChain / LangGraph:社群最大、生態最廣,跟 ADK 是直接競爭關係。
  • LlamaIndex:偏「文件問答 / RAG」起家,現在也有 agent 模組。
  • CrewAI:專注 multi-agent 協作,比 ADK 早出。
  • OpenAI Agents SDK:OpenAI 自家的 agent 套件,跟 ADK 同類但綁 OpenAI 模型。

ADK 的差別是它由 Google 官方維護、跟 Gemini 整合最順、multi-agent 架構是賣點。已經很熟 LangChain 的人沒必要硬換,但要從零開始選一個官方框架,ADK 是合理選擇。

使用上要小心的事

  • Agent 會做錯事,尤其開了「能呼叫工具」之後,可能呼叫錯的 API、給錯的參數。第一次玩務必只給它讀取類工具,不要直接給寫入或刪除權限。
  • API key 不要寫死在 code 裡,用環境變數或 secret manager 管,commit 前確認 .env.gitignore
  • Token 費用會跑,multi-agent 架構容易讓 token 爆掉(agent 之間互相對話也算 token),一定要用內建的 token 追蹤盯著用量。
  • ADK 還很新(2025–2026 才推),部分 API 可能在小版本之間改,固定一個版本號比較保險。
  • 部署到 Vertex AI 會綁雲,方便但會多一層 Google Cloud 帳單,本機跑得起來再考慮上雲。
  • Multi-agent 不一定比 single-agent 強,很多任務一個 agent 加幾個工具就夠,硬切多 agent 反而慢、貴、難 debug。

想開始用 Google ADK?

兩件事先決定:

  1. 先在本機跑通最小範例:拿 Gemini 免費 key、寫 10 行 Python、跑 adk web 看到對話框出來,這一步通就成功 80%。
  2. 先用 single-agent 加一兩個工具,不要一上來就玩 multi-agent。先確認你能讓 agent 正確呼叫一個自己寫的函式,再考慮分工架構。

如果你只是想「用」AI agent,不是想「寫」agent,ADK 不是給你的工具,去看拉節點的 n8nFlowise

下一步可以先看什麼

參考來源

  • ADK GitHub:https://github.com/google/adk-python
  • 官方文件:https://google.github.io/adk-docs/
  • Google Cloud Vertex AI Agent Builder:https://cloud.google.com/vertex-ai/generative-ai/docs/agent-engine/develop/adk

本文最後查證日期:2026-05-20

延伸閱讀

Flowise 是什麼?用拖拉節點建立 AI agent 工作流的開源工具

Flowise 是熱門的開源視覺化 AI agent builder,讓你用節點拖拉方式串模型、工具、資料來源與流程。這篇用新手角度比較 Flowise、Dify、Langflow、n8n,幫你判斷值不值得試。

browser-use 是什麼?讓 AI 自己操作瀏覽器的熱門開源工具

browser-use 是熱門的開源瀏覽器自動化工具,主打讓 AI agent 可以看網頁、點按鈕、填表單、完成網站任務。這篇用新手角度說明它好不好上手、適合哪些任務,以及跟 Playwright、Firecrawl 差在哪。

n8n 是什麼?AI 自動化工作流工具的功能、限制與新手使用建議

用中文白話整理 n8n 的功能、適合對象、使用限制、風險提醒與替代工具,幫助非工程師判斷是否值得使用。

Crawl4AI 是什麼?免費開源、專門把網頁變成餵 AI 資料的爬蟲

Crawl4AI 是 GitHub 上很紅的開源網頁爬蟲,專門把網頁抓下來、轉成乾淨的 Markdown 餵給 AI。這篇用新手角度說明它能幹嘛、跟 Firecrawl 差在哪、要不要錢、什麼人適合用,以及爬網頁前要注意的風險。

Khoj 是什麼?能搜尋你筆記、可自架的 AI 第二大腦

Khoj 是一個開源、可自架的「AI 第二大腦」,能把你的筆記、PDF、文件變成可以用自然語言問答的個人 AI,還能接 Obsidian、手機、桌面。這篇用新手角度說明它能幹嘛、跟 NotebookLM 和 AnythingLLM 差在哪、要不要錢、怎麼開始。

OpenHands 是什麼?會自己寫 code、跑指令的開源 AI 工程師

OpenHands(前身 OpenDevin)是一個開源的 AI 軟體工程 agent,能自己讀專案、寫程式、跑終端機指令、開瀏覽器、甚至發 pull request。這篇用新手角度說明它能幹嘛、跟 Cursor 和 Cline 差在哪、要不要錢、怎麼低風險試,以及它最該注意的安全問題。