⚡️如果你也想做自己的 ASR 工具
先找個能比較效能與效果的現成方案吧!
這篇短文限時免費開放。歡迎成為會員,即可閱讀我的 180+ 篇文章。
最近在 Threads 上看到不少人停用 Typeless,轉而自己用 AI 做一版。至少看到 4、5 個吧。
先說,我沒有用過 Typeless,對它沒有評論。還有我不喜歡讓 AI 修飾我的文字,所以 ASR 之後用 LLM 處理的部分,也不予置評。
雖然市面上已經有很多類似的解決方案(Typeless 之前有 WisprFlow,更早之前就有 MacWhisper),但我覺得每個人做符合自己需求的一版沒有錯。
去年我就一直在說「個人軟體時代」:只要工具不符合習慣,用 AI 為自己量身打造一個很好,可以學到很多東西。
(至於要不要產品化/商業化,就另當別論。)
不過真的要做的話,我建議先找個方便比較模型轉錄效果與效能的現成工具。
我在教學本地 ASR 模型時,都會從 Spokenly 這個 Mac app 教起(這不是廣告文)。
它有完全離線的模式、可以免費使用、多種模型可以下載與切換、換模型重轉的功能。其中也包括 Apple 自己的離線模型。
所以,要做自己的版本,我會拿它當作 ASR 功能/效能/效果參考。
我還會把核心做成 CLI,讓其他工具如 OpenClaw 能使用。畢竟,做自己的工具,關鍵還是在打造個人系統。