AI 工具雷達
GitHub 與進階 AI 工具新手難度:Docker:視使用方式而定來源:GitHub5 分鐘閱讀

Maxun 是什麼?用點選的方式把網站變成表格,不用寫爬蟲

編輯:BJ最後檢查:2026-06-09主要來源:GitHub

Maxun 是開源的 no-code 網頁擷取工具,你在畫面上點一點要哪些欄位,它就把整個網站抓成表格或 API,不用寫程式。這篇用新手角度說明它能幹嘛、適合誰、怎麼開始,以及跟 Firecrawl、Crawl4AI、browser-use 怎麼分。

Maxun 用點選錄製把網站欄位抓成表格或 API 的流程示意圖
自製示意圖:Maxun 的重點是『在畫面上點選欄位』,不用寫爬蟲程式。

Maxun 想解決什麼問題

想把網站上的資料整理成表格,過去只有兩條路:手動複製貼上,或者寫爬蟲程式。前者很累,幾百筆就崩潰;後者要會寫 code、還要處理分頁、無限捲動、網站改版,門檻不低。

Maxun 想做的是中間那條路:你在畫面上直接點要抓哪些欄位,它記住你的動作,做成一個會自動跑的「擷取機器人」,把整個網站抓成表格、Google Sheet 或 API。整個過程不用寫程式。

費用先講清楚。Maxun 有兩種用法:官方的雲端版(app.maxun.dev)可以直接註冊試用,有免費額度;開源版可以自己用 Docker 架,工具本身免費,但要自己付伺服器、自己維護。

它怎麼運作?兩種模式

Maxun 抓資料主要靠兩種方式:

  • 錄製模式(Recorder Mode):你像平常一樣瀏覽網站,點一下要抓的標題、點一下要抓的價格、告訴它「下一頁」按鈕在哪,它就把這串動作錄成一個機器人。之後這個機器人會自己重複跑。
  • AI 模式(AI Mode):你用一句話描述要什麼(例如「抓出每個商品的名稱和價格」),讓 AI 幫你判斷要抓哪些欄位。

抓完的資料可以匯出成表格、接 Google Sheet 或 Airtable,也可以變成 API 讓別的程式來拿。

它適合誰

適合「需要網站資料,但不想寫爬蟲」的人。常見的人:

  • 做市場調查、想定期抓競品價格或商品清單。
  • 做名單蒐集、要從目錄型網站整理聯絡資訊。
  • 做內容彙整、想把多個來源的資料收成一張表。
  • 會用 Excel、但不會寫 Python 的人。

如果你只是偶爾抓一兩筆,手動複製就好,不需要它。如果你要重複抓、定期抓、抓很多頁,Maxun 才划算。

新手好不好上手?

「點選抓欄位」這件事本身很直覺,這是 Maxun 最大的賣點。難的地方不在操作,而在兩件事:

第一,自架有點門檻。開源版要用 Docker,背後還要跑 PostgreSQL、Redis、MinIO 幾個服務。如果你沒碰過 Docker,建議先用雲端版試,確定好用再考慮自架。

第二,網站越複雜越容易卡。需要登入、有驗證碼、大量 JavaScript 動態載入的網站,錄製時可能要多試幾次。先拿乾淨、單純的目錄型網站練手,不要一開始就挑最難的。

最小試法:

  1. 用雲端版註冊一個帳號。
  2. 找一個公開的商品列表或文章列表頁。
  3. 錄一個機器人,只抓「標題」一個欄位。
  4. 跑跑看,確認抓出來的清單對不對。
  5. 對了再加欄位、加分頁。

先抓一個欄位驗證流程,再慢慢加。

跟 Firecrawl、Crawl4AI、browser-use 怎麼分工

這幾個都跟「網站資料」有關,但定位差很多,別搞混:

  • Maxun:你點選要哪些欄位,輸出結構化表格。重點是 no-code、給人用、要的是「乾淨的欄位資料」。
  • Firecrawl:把整頁網站抓成 Markdown 或 JSON,主要透過 API,給開發者接在 AI 流程前面。
  • Crawl4AI:偏寫程式的爬蟲,專門把網頁整理成適合丟給 LLM 的格式。
  • browser-use:不是抓資料,是讓 AI 操作網站,登入、點按鈕、填表單、完成多步驟任務。

一句話分:

  • 想用點選抓出表格、不寫程式:Maxun
  • 想用 API 把網頁變 Markdown 餵 AI:Firecrawl
  • 自己寫爬蟲、要給 LLM 用的格式:Crawl4AI
  • 要 AI 幫你操作網站完成任務:browser-use

使用上要小心的事

第一,抓資料不是想抓就能抓。要注意網站條款、robots.txt、登入限制、個資與版權。很多網站在使用條款裡明文禁止自動抓取,公開頁也一樣。商業用途前最好確認清楚,必要時問過法務。

第二,Maxun 還算年輕。官方在專案頁也標注仍在早期開發階段,代表功能還在變、可能踩到 bug、版本更新可能要重設。拿來做正式、長期、不能斷的生產流程前要先評估。

第三,網站改版機器人會壞。你錄好的機器人是綁在網站當下的版面上的,對方一改版,欄位就可能抓錯或抓空,要回去重錄。定期抓的人要有人顧。

想開始用 Maxun?

我會用這個順序:

  1. 先用雲端版,拿一個單純的列表頁,只抓一個欄位試。
  2. 確認抓出來的資料正確,再加欄位、加分頁。
  3. 要定期跑,再設排程、接 Google Sheet。
  4. 確定真的常用、又在意資料隱私,最後才考慮 Docker 自架。

先證明「它抓得準」,再談自動化和自架。如果你常常要從網站整理表格,Maxun 很值得試;如果你只是偶爾抓幾筆,手動複製還比較快。

下一步可以先看什麼

參考來源

  • Maxun GitHub:https://github.com/getmaxun/maxun
  • Maxun 官方網站:https://www.maxun.dev

本文最後查證日期:2026-06-09

延伸閱讀

Firecrawl 是什麼?把網站抓成 AI 可以使用的資料

Firecrawl 是熱門的開源網頁抓取工具,可以把網站內容整理成 Markdown 或結構化資料,常被放在 AI agent、RAG、知識庫與資料蒐集流程前面。這篇用新手角度說明它能幹嘛、適合誰、跟 MarkItDown 和 browser-use 怎麼分。

Crawl4AI 是什麼?免費開源、專門把網頁變成餵 AI 資料的爬蟲

Crawl4AI 是 GitHub 上很紅的開源網頁爬蟲,專門把網頁抓下來、轉成乾淨的 Markdown 餵給 AI。這篇用新手角度說明它能幹嘛、跟 Firecrawl 差在哪、要不要錢、什麼人適合用,以及爬網頁前要注意的風險。

browser-use 是什麼?讓 AI 自己操作瀏覽器的熱門開源工具

browser-use 是熱門的開源瀏覽器自動化工具,主打讓 AI agent 可以看網頁、點按鈕、填表單、完成網站任務。這篇用新手角度說明它好不好上手、適合哪些任務,以及跟 Playwright、Firecrawl 差在哪。

Flowise 是什麼?用拖拉節點建立 AI agent 工作流的開源工具

Flowise 是熱門的開源視覺化 AI agent builder,讓你用節點拖拉方式串模型、工具、資料來源與流程。這篇用新手角度比較 Flowise、Dify、Langflow、n8n,幫你判斷值不值得試。

Hermes Agent 是什麼?開源自我學習 AI Agent 的功能、限制與使用建議

用中文白話介紹 Nous Research 的 Hermes Agent:它和一般聊天機器人、AI coding agent 有什麼不同,適合誰、風險在哪、新手該不該現在就用。

n8n 是什麼?AI 自動化工作流工具的功能、限制與新手使用建議

用中文白話整理 n8n 的功能、適合對象、使用限制、風險提醒與替代工具,幫助非工程師判斷是否值得使用。