AI Token 計算完全指南:精準掌握 API 成本
什麼是 Token?
在大型語言模型(LLM)的世界中,Token 是文本處理的最小單位。它不等同於一個字或一個詞,而是介於字元和詞之間的概念。理解 Token 的運作方式,是有效控制 AI API 成本的第一步。
Token 的基本概念
以英文為例,一個 Token 大約等於 4 個字元或 0.75 個單詞。常見的英文單詞如 "hello" 就是一個 Token,但較長的單詞如 "extraordinary" 可能會被拆分為 "extra" + "ordinary" 兩個 Token。
中文的情況則完全不同。由於中文字元的 Unicode 編碼較複雜,每個中文字通常需要 1-3 個 Token。這意味著同樣的語意內容,中文版本消耗的 Token 數量往往是英文的 1.5-2 倍。
BPE 分詞演算法解析
Byte Pair Encoding 原理
大多數主流 LLM 使用 BPE(Byte Pair Encoding) 分詞法。這是一種統計方法,通過反覆合併最常見的字元對來建立詞彙表。
BPE 的工作流程如下:
- 初始化:將所有文本拆分為單個字元
- 統計頻率:找出最常見的相鄰字元對
- 合併:將最高頻的字元對合併為新的 Token
- 重複:直到達到預設的詞彙表大小
例如,"lower" 這個詞在 BPE 處理後,可能是 "low" + "er" 兩個 Token,因為 "er" 是一個非常常見的英文後綴。
不同模型的分詞差異
各家 AI 公司使用不同的分詞器:
- GPT-4(OpenAI):使用 cl100k_base 分詞器,詞彙表約 10 萬個 Token
- Claude 3(Anthropic):使用自家訓練的分詞器,對自然語言和程式碼都有良好支持
- Gemini(Google):使用 SentencePiece 分詞器,支持多語言
這些分詞器的差異會導致相同的文本在不同模型中產生不同數量的 Token。例如,一段 100 字的中文文本: - GPT-4:約 150-200 Token - Claude 3:約 120-170 Token - Gemini:約 130-180 Token
各模型 Token 定價比較
2026 年主流 AI API 定價
| 模型 | 輸入 Token (每百萬) | 輸出 Token (每百萬) | 上下文窗口 |
|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | 128K |
| GPT-4o mini | $0.15 | $0.60 | 128K |
| Claude Opus 4 | $15.00 | $75.00 | 200K |
| Claude Sonnet 4 | $3.00 | $15.00 | 200K |
| Claude Haiku 3.5 | $0.80 | $4.00 | 200K |
| Gemini 2.0 Pro | $1.25 | $5.00 | 1M |
| Gemini 2.0 Flash | $0.075 | $0.30 | 1M |
成本計算公式
API 成本 = (輸入 Token × 輸入價格) + (輸出 Token × 輸出價格)
例如,使用 Claude Sonnet 4 處理一個包含 2000 Token 輸入、500 Token 輸出的請求:
成本 = (2000 / 1,000,000 × $3.00) + (500 / 1,000,000 × $15.00)
= $0.006 + $0.0075
= $0.0135(約 NT$0.44)
實戰:Token 估算技巧
快速估算法則
英文: - 1 個單詞 ≈ 1.3 Token - 1 個句子 ≈ 15-25 Token - 1 頁 A4(500 字)≈ 650 Token
中文: - 1 個字 ≈ 1.5-2 Token - 1 個句子 ≈ 20-40 Token - 1 頁 A4(800 字)≈ 1200-1600 Token
程式碼: - 1 行程式碼 ≈ 5-15 Token - 100 行 Python ≈ 800-1200 Token - 100 行 JSON ≈ 400-600 Token
多語言 Token 差異
不同語言的 Token 效率差異很大:
| 語言 | 100 字的 Token 數(約) | 效率排名 |
|---|---|---|
| 英文 | 130 | 1 |
| 西班牙文 | 150 | 2 |
| 法文 | 160 | 3 |
| 日文 | 180 | 4 |
| 中文 | 190 | 5 |
| 韓文 | 200 | 6 |
| 阿拉伯文 | 220 | 7 |
這是因為 BPE 分詞器的訓練資料以英文為主,對非拉丁語系的壓縮效率較低。
API 成本優化策略
1. 精簡 Prompt 設計
避免冗餘的指令。比較以下兩個 Prompt:
冗長版(約 80 Token):
你是一個非常有經驗的、專業的、頂級的翻譯專家。我希望你能夠幫助我把下面的這段中文文字翻譯成英文,翻譯的時候請注意語法正確、語意通順、符合英文母語者的表達習慣。
精簡版(約 20 Token):
翻譯成英文,保持自然語感:
兩者效果相似,但 Token 消耗差 4 倍。
2. 選擇合適的模型
- 簡單任務(分類、摘要、格式轉換)→ 用小模型(GPT-4o mini、Haiku)
- 複雜推理(程式碼生成、多步驟分析)→ 用大模型(GPT-4o、Sonnet)
- 創意寫作(故事、行銷文案)→ 用最強模型(Opus)
3. 快取與批次處理
- Prompt Caching:OpenAI 和 Anthropic 都支持 Prompt 快取,重複的 system prompt 可享 50-90% 折扣
- Batch API:非即時任務使用批次處理,通常可享 50% 折扣
- 本地快取:相同查詢結果緩存,避免重複呼叫
4. 上下文管理
- 及時清理對話歷史中不再需要的訊息
- 使用摘要替代完整歷史
- 只保留最近 N 輪對話
常見問題 FAQ
Q:為什麼同一段文字在不同模型中 Token 數不同?
A:因為每個模型使用不同的分詞器和詞彙表。即使是同一家公司的不同版本模型,分詞結果也可能不同。
Q:程式碼的 Token 效率如何?
A:程式碼的 Token 效率取決於語言。Python 因為語法簡潔,Token 效率較高;JSON 和 XML 因為大量重複的結構標記,Token 效率較低。
Q:如何估算圖片的 Token 成本?
A:GPT-4V 的圖片 Token 取決於解析度:低解析度固定 85 Token,高解析度按 512×512 瓦片計算,每片 170 Token。Claude 的圖片 Token 計算方式類似但數值不同。
Q:免費的 Token 計算工具推薦?
A:Super Tools 提供免費的 AI Token 估算工具,支持 GPT-4、Claude 3、Gemini 等主流模型,可同時計算 Token 數量和預估成本。
Q:如何減少中文的 Token 消耗?
A:可以考慮以下方法: 1. 去除不必要的標點符號和空白 2. 使用簡潔的表達方式 3. 對於系統提示詞,考慮用英文撰寫(Token 更省) 4. 利用 Prompt Caching 減少重複消耗
結語
掌握 Token 計算是有效使用 AI API 的關鍵技能。透過理解 BPE 分詞原理、各模型的定價結構、以及成本優化策略,你可以在保持 AI 應用品質的同時,大幅降低 API 開支。建議使用 Super Tools 的 AI Token 計算工具,在開發前精準估算成本,避免帳單超出預期。