8 min read

AI Agent 怎麼「思考」?拆解背後的運作原理

想搞懂 AI Agent 運作原理?用「交代助理辦事」的比喻,拆解 Agent 的思考循環:想 → 做 → 看結果,循環直到任務完成。
AI Agent 怎麼「思考」?拆解背後的運作原理

你有沒有試過,把一件事交代給別人之後,就開始好奇:他現在腦袋裡到底在想什麼? 😂

比如你請一個朋友幫你訂餐廳,說:「找一間不太貴、環境不錯、有素食選項的餐廳,這週五晚上可以訂位的。」然後他說「好」,就拿起手機開始查了。

你看著他滑手機,但你不知道他到底查了什麼、排除了哪些選項、為什麼點開某個頁面又關掉。最後他給你一個答案,你說「好耶!」但你完全不知道中間發生了什麼事。

AI Agent 也是這樣。

你給它一個任務,它說「好,我來處理」,然後開始動。但它中間到底在做什麼?今天就來拆解這個黑盒子,看看 AI Agent 背後的「思考流程」。

這是 Claude Cowork 打造 AI Agent 系列的第三篇,如果你還沒看過前兩篇,建議先從這裡開始:

今天要聊的:

  • 為什麼 AI Agent 的「思考」跟 ChatBot 不一樣
  • Agent 的思考循環:想 → 做 → 看結果
  • 用「交代助理辦事」來具體理解這個流程
  • 在 Cowork 裡看到實際的思考過程

ChatBot 的「思考」只有一個回合

在上一篇,我們說 ChatBot 的模式是:你問 → 它答 → 你再問 → 它再答

從「思考」的角度來說,ChatBot 每次都是一次性的推理。你給它一個輸入,它根據這個輸入產出一個回答,然後就結束了。沒有中間步驟,沒有自己去查資料,沒有「嗯,這樣不行,換個方向試試看」。

就像你問路人「車站怎麼走」,路人根據他腦袋裡現有的知識告訴你方向,說完就走了。他不會幫你確認那條路今天有沒有在施工,也不會幫你查備用路線。

AI Agent 不一樣。它會持續地思考、行動、再思考,直到把任務完成。


AI Agent 的思考循環:想 → 做 → 看結果

這個循環有個學術名字叫做 ReAct(Reasoning + Acting),但我們不用記這個英文,理解概念就好。

整個流程就三步:

第一步:想(Thought)

Agent 先想:「我現在的狀況是什麼?我需要做什麼?我該怎麼做到?」

這不是一次就想好所有事情。而是在每個節點上,根據目前掌握的資訊,決定下一步要做什麼

第二步:做(Action)

Agent 根據剛才的思考,採取一個行動。通常是使用某個工具——搜尋網頁、讀取檔案、執行指令、計算數字,等等。

注意,它每次只採取一個行動,然後等待結果。

第三步:看結果(Observation)

工具執行完之後,結果回來了。Agent 看到這個結果,然後重新回到第一步:「好,現在我知道了這個,接下來應該怎麼辦?」

然後繼續:想 → 做 → 看結果 → 想 → 做 → 看結果⋯⋯直到任務完成。


用「交代助理辦事」來理解

讓我們把這個循環套回我們熟悉的場景。

你跟助理說:「幫我找一個這週五可以訂位的素食友善餐廳,預算中等,環境不錯,整理成一份選項給我。」

助理的思考過程大概是這樣:

💭 :我要找素食餐廳,先去搜尋台北的素食餐廳評價。

🔧 :搜尋「台北 素食餐廳 推薦 2026」

👀 看結果:找到一堆結果,有10家評價不錯的。

💭 :現在有10家候選,但我要篩出「預算中等、環境不錯」的,去看一下他們的價位和評論。

🔧 :逐一查看各家餐廳的菜單和評論

👀 看結果:3家符合條件。

💭 :還要確認這週五可以訂位,打電話問或是查官網。

🔧 :查看各餐廳的訂位系統

👀 看結果:2家可以訂位,1家週五客滿了。

💭 :好,現在有2個可以推薦的選項,來整理成一份清單給老闆。

🔧 :寫出推薦清單,附上各家特色、價位範圍、訂位方式。

完成:交給你。

你看到的只是最後那份清單,但中間助理跑了好幾個循環:搜尋 → 篩選 → 確認 → 整理。每一步的結果都影響下一步要做什麼。

AI Agent 的運作方式,就是這樣。


在 Cowork 裡,你可以直接看到這個過程

這就是 Claude Cowork 最有趣的地方之一:Agent 的思考過程是透明的

當你交給 Cowork 一個任務,它不是直接給你答案,而是把每一個「想 → 做 → 看結果」的步驟都顯示出來:

  • 「我需要先讀取這個資料夾裡有哪些檔案」→ 讀取 → 「好,我看到了 23 個 .md 檔」
  • 「接著我要分析每個檔案的日期」→ 逐一讀取 → 「好,找到了日期格式不一致的問題」
  • 「我來把格式統一好」→ 逐一修改 → 「修改完成,共處理了 18 個檔案」

你全程都能看到它在做什麼,也能隨時插嘴說「不對,這樣不行,改成這樣做」。

Claude Cowork AI Agent 思考過程 Tool Use 詳細紀錄

從圖中可以看出,Cowork 在最後回答之前,先去檢查資料夾結構、讀了我以前的文章、上網搜尋收集資訊,最後才完成我的任務。這就是「想 → 做 → 看結果」的循環在現實中跑起來的樣子。

這種透明度有兩個好處:

  1. 你知道它在做什麼,不用擔心它偷偷做了你不想要的事
  2. 出錯了你能馬上發現,不用等到最後才發現方向跑掉了

為什麼這個循環很重要?

你可能會問:這種「一步一步來」的方式,比不上直接給答案快啊?

沒錯,一次性的問答確實比較快。但問題是:有很多任務,沒有辦法一次性完成

比如「幫我整理這個月的工作筆記,找出還沒完成的待辦事項,整理成一份清單」——要做到這件事,Agent 必須先讀你的筆記、理解內容、判斷哪些是未完成的、再整理成清單。每一步都需要上一步的結果。

這就是為什麼 ChatBot 做不到 Agent 能做的事:ChatBot 只有一個思考回合,沒有「根據中間結果調整計劃」的能力。

而這套 Agent 工作流程,讓它能夠:

  • 處理多步驟的複雜任務
  • 根據實際結果調整方向
  • 在中途遇到問題時自己想辦法

一個小提醒:Agent 也會想錯

講到這裡,我要誠實說一件事:Agent 的思考不是完美的

有時候它對任務的理解會有偏差,或者中間某個工具回傳了奇怪的結果,它就走歪了。這也是為什麼「透明的思考過程」那麼重要——你能看到哪個環節出了問題。

就像你找的助理也有可能理解錯你的需求,或者查到了錯誤的資訊。這時候你要做的不是直接叫他重來,而是看看是哪一步出了問題,然後給他更清楚的指引。

所以在用 Cowork 的時候,偶爾看一眼它在做什麼,是個好習慣。


結語

今天我們拆解了 AI Agent 的運作原理與思考方式:

  • 它不是「一問一答」,而是不斷循環「想 → 做 → 看結果」,直到完成任務
  • 每一步的結果都影響下一步的決策
  • 在 Cowork 裡,你可以直接看到這個思考過程,而不是只看到最終答案

理解這個循環,可以幫助你更好地跟 AI Agent 協作——知道它在做什麼,也知道哪裡可以介入指引它。

這是 Claude Cowork 打造 AI Agent 系列的第三篇。下一篇我們要聊的是:Skill 是什麼?讓 AI Agent 從通才變專家 — 也就是說,怎麼給你的 Agent 準備一份 SOP,讓它每次都能按照你想要的方式做事。

希望以上的內容對大家有一丁點兒的幫助,掰掰~👋