AI Agent 怎麼「思考」?拆解背後的運作原理
你有沒有試過,把一件事交代給別人之後,就開始好奇:他現在腦袋裡到底在想什麼? 😂
比如你請一個朋友幫你訂餐廳,說:「找一間不太貴、環境不錯、有素食選項的餐廳,這週五晚上可以訂位的。」然後他說「好」,就拿起手機開始查了。
你看著他滑手機,但你不知道他到底查了什麼、排除了哪些選項、為什麼點開某個頁面又關掉。最後他給你一個答案,你說「好耶!」但你完全不知道中間發生了什麼事。
AI Agent 也是這樣。
你給它一個任務,它說「好,我來處理」,然後開始動。但它中間到底在做什麼?今天就來拆解這個黑盒子,看看 AI Agent 背後的「思考流程」。
這是 Claude Cowork 打造 AI Agent 系列的第三篇,如果你還沒看過前兩篇,建議先從這裡開始:
今天要聊的:
- 為什麼 AI Agent 的「思考」跟 ChatBot 不一樣
- Agent 的思考循環:想 → 做 → 看結果
- 用「交代助理辦事」來具體理解這個流程
- 在 Cowork 裡看到實際的思考過程
ChatBot 的「思考」只有一個回合
在上一篇,我們說 ChatBot 的模式是:你問 → 它答 → 你再問 → 它再答。
從「思考」的角度來說,ChatBot 每次都是一次性的推理。你給它一個輸入,它根據這個輸入產出一個回答,然後就結束了。沒有中間步驟,沒有自己去查資料,沒有「嗯,這樣不行,換個方向試試看」。
就像你問路人「車站怎麼走」,路人根據他腦袋裡現有的知識告訴你方向,說完就走了。他不會幫你確認那條路今天有沒有在施工,也不會幫你查備用路線。
AI Agent 不一樣。它會持續地思考、行動、再思考,直到把任務完成。
AI Agent 的思考循環:想 → 做 → 看結果
這個循環有個學術名字叫做 ReAct(Reasoning + Acting),但我們不用記這個英文,理解概念就好。
整個流程就三步:
第一步:想(Thought)
Agent 先想:「我現在的狀況是什麼?我需要做什麼?我該怎麼做到?」
這不是一次就想好所有事情。而是在每個節點上,根據目前掌握的資訊,決定下一步要做什麼。
第二步:做(Action)
Agent 根據剛才的思考,採取一個行動。通常是使用某個工具——搜尋網頁、讀取檔案、執行指令、計算數字,等等。
注意,它每次只採取一個行動,然後等待結果。
第三步:看結果(Observation)
工具執行完之後,結果回來了。Agent 看到這個結果,然後重新回到第一步:「好,現在我知道了這個,接下來應該怎麼辦?」
然後繼續:想 → 做 → 看結果 → 想 → 做 → 看結果⋯⋯直到任務完成。
用「交代助理辦事」來理解
讓我們把這個循環套回我們熟悉的場景。
你跟助理說:「幫我找一個這週五可以訂位的素食友善餐廳,預算中等,環境不錯,整理成一份選項給我。」
助理的思考過程大概是這樣:
💭 想:我要找素食餐廳,先去搜尋台北的素食餐廳評價。
🔧 做:搜尋「台北 素食餐廳 推薦 2026」
👀 看結果:找到一堆結果,有10家評價不錯的。
💭 想:現在有10家候選,但我要篩出「預算中等、環境不錯」的,去看一下他們的價位和評論。
🔧 做:逐一查看各家餐廳的菜單和評論
👀 看結果:3家符合條件。
💭 想:還要確認這週五可以訂位,打電話問或是查官網。
🔧 做:查看各餐廳的訂位系統
👀 看結果:2家可以訂位,1家週五客滿了。
💭 想:好,現在有2個可以推薦的選項,來整理成一份清單給老闆。
🔧 做:寫出推薦清單,附上各家特色、價位範圍、訂位方式。
✅ 完成:交給你。
你看到的只是最後那份清單,但中間助理跑了好幾個循環:搜尋 → 篩選 → 確認 → 整理。每一步的結果都影響下一步要做什麼。
AI Agent 的運作方式,就是這樣。
在 Cowork 裡,你可以直接看到這個過程
這就是 Claude Cowork 最有趣的地方之一:Agent 的思考過程是透明的。
當你交給 Cowork 一個任務,它不是直接給你答案,而是把每一個「想 → 做 → 看結果」的步驟都顯示出來:
- 「我需要先讀取這個資料夾裡有哪些檔案」→ 讀取 → 「好,我看到了 23 個 .md 檔」
- 「接著我要分析每個檔案的日期」→ 逐一讀取 → 「好,找到了日期格式不一致的問題」
- 「我來把格式統一好」→ 逐一修改 → 「修改完成,共處理了 18 個檔案」
你全程都能看到它在做什麼,也能隨時插嘴說「不對,這樣不行,改成這樣做」。

從圖中可以看出,Cowork 在最後回答之前,先去檢查資料夾結構、讀了我以前的文章、上網搜尋收集資訊,最後才完成我的任務。這就是「想 → 做 → 看結果」的循環在現實中跑起來的樣子。
這種透明度有兩個好處:
- 你知道它在做什麼,不用擔心它偷偷做了你不想要的事
- 出錯了你能馬上發現,不用等到最後才發現方向跑掉了
為什麼這個循環很重要?
你可能會問:這種「一步一步來」的方式,比不上直接給答案快啊?
沒錯,一次性的問答確實比較快。但問題是:有很多任務,沒有辦法一次性完成。
比如「幫我整理這個月的工作筆記,找出還沒完成的待辦事項,整理成一份清單」——要做到這件事,Agent 必須先讀你的筆記、理解內容、判斷哪些是未完成的、再整理成清單。每一步都需要上一步的結果。
這就是為什麼 ChatBot 做不到 Agent 能做的事:ChatBot 只有一個思考回合,沒有「根據中間結果調整計劃」的能力。
而這套 Agent 工作流程,讓它能夠:
- 處理多步驟的複雜任務
- 根據實際結果調整方向
- 在中途遇到問題時自己想辦法
一個小提醒:Agent 也會想錯
講到這裡,我要誠實說一件事:Agent 的思考不是完美的。
有時候它對任務的理解會有偏差,或者中間某個工具回傳了奇怪的結果,它就走歪了。這也是為什麼「透明的思考過程」那麼重要——你能看到哪個環節出了問題。
就像你找的助理也有可能理解錯你的需求,或者查到了錯誤的資訊。這時候你要做的不是直接叫他重來,而是看看是哪一步出了問題,然後給他更清楚的指引。
所以在用 Cowork 的時候,偶爾看一眼它在做什麼,是個好習慣。
結語
今天我們拆解了 AI Agent 的運作原理與思考方式:
- 它不是「一問一答」,而是不斷循環「想 → 做 → 看結果」,直到完成任務
- 每一步的結果都影響下一步的決策
- 在 Cowork 裡,你可以直接看到這個思考過程,而不是只看到最終答案
理解這個循環,可以幫助你更好地跟 AI Agent 協作——知道它在做什麼,也知道哪裡可以介入指引它。
這是 Claude Cowork 打造 AI Agent 系列的第三篇。下一篇我們要聊的是:Skill 是什麼?讓 AI Agent 從通才變專家 — 也就是說,怎麼給你的 Agent 準備一份 SOP,讓它每次都能按照你想要的方式做事。
希望以上的內容對大家有一丁點兒的幫助,掰掰~👋