🧠13 的 brainOS:開發日誌之 GPT-5.2-Codex 認真用

從 Cursor 到 Claude Code,再到 Codex(GPT-5.2-Codex),都在更新我對 AI 工具能力的認知。我列舉了幾個在短時間把全專案翻修或重寫的例子。然而最重要的還是,我們想做什麼?

讀者可能發現有好幾天沒收到 13+ 的新文章。簡單來說,我在調整寫作方向與工作步調。上週我從旅行休假回來以後,一頭栽進了使用新 AI 工具開發的樂趣中,所以這篇是要來分享這個過程。

原本安排好 1 月份要寫的 brainOS 系列文章,是用「以軟體工程的概念來類比 13 的學習、思考、工作方式」,而且我有很多主題可以寫。但是實際上要寫各篇時,大腦卻覺得頻率不對。

該怎麼辦呢?我想,既然「13 的 brainOS」是要分享自己的學習、思考、工作方式,也不見得每篇都要寫出某個道理。如果我的軟體開發工作有一些值得分享的東西,就可以拿出來講,同時加上自己的思考。

今天的文章,就來分享一下我從休假回來以後,認真使用 AI 工具進行開發的體驗:放下 Claude Code,跳來使用 Codex 的一些心得。

一開始對 Codex CLI 的印象並不好

我是在 2025 年 6 月入坑 Claude Code 這種 Agentic CLI 的開發工具,在🔥來玩 Claude Code 吧這篇有介紹到。

後來,OpenAI 也更新了 Codex CLI,但是我一直沒有很喜歡用。最主要的原因是,我覺得跟 Claude Code 一起工作起來,比較像是有在認真互動的同事。他會給出很多訊息,不確定的事情會回來問我,而且我可以隨時改變主意,把訊息接在後面,他會一併考慮進去。

而 Codex 使用起來,則更像是個安靜的同事。用與 Claude Code 相同的 prompt 對話,Codex 不太會確認我對我指令的理解,也不討論計畫,而是直接開始做,而且開發的時間也不短,才讓我確認。這種低互動的 AI 工具,很難取得我的信任。

所以有好長一段時間我還是偏愛 Claude Code。可以說,悶頭苦幹型的工程師,總是比較吃虧。

GPT-5.2-Codex 與 Codex CLI

情況出現變化,是我發現 Claude Code 的極限。用 Claude Opus 4.5 模型很貴,我的 Pro 方案很快就會用完,而 Sonnet 4.5 又沒那麼聰明。

在 5 小時額度用完的時候,我就會切換試試看 Codex,因為我有訂閱 ChatGPT Plus。

GPT-5.2-Codex 模型推出以後,軟體開發能力已經不輸給 Opus。而且 Codex 讓我感覺到,它很能正確理解我想要做的修改,即使沒有跑測試或編譯 app,也往往能夠一次搞定。

過去我很仰賴 Claude Code 自動跑 xcodebuild test,從測試與編譯錯誤當中自我修正。這招雖然有效,但是很慢,而且非常消耗 token 與 context window。而 GPT-5.2-Codex 往往能做到直接寫對。

既然模型有這種一次到位的能力,那我也不客氣了。我丟給 Codex 的重度工作有這些: