AI Token 計算完全指南:精準掌握 API 成本

什麼是 Token?

在大型語言模型(LLM)的世界中,Token 是文本處理的最小單位。它不等同於一個字或一個詞,而是介於字元和詞之間的概念。理解 Token 的運作方式,是有效控制 AI API 成本的第一步。

Token 的基本概念

以英文為例,一個 Token 大約等於 4 個字元或 0.75 個單詞。常見的英文單詞如 "hello" 就是一個 Token,但較長的單詞如 "extraordinary" 可能會被拆分為 "extra" + "ordinary" 兩個 Token。

中文的情況則完全不同。由於中文字元的 Unicode 編碼較複雜,每個中文字通常需要 1-3 個 Token。這意味著同樣的語意內容,中文版本消耗的 Token 數量往往是英文的 1.5-2 倍。

BPE 分詞演算法解析

Byte Pair Encoding 原理

大多數主流 LLM 使用 BPE(Byte Pair Encoding) 分詞法。這是一種統計方法,通過反覆合併最常見的字元對來建立詞彙表。

BPE 的工作流程如下:

  1. 初始化:將所有文本拆分為單個字元
  2. 統計頻率:找出最常見的相鄰字元對
  3. 合併:將最高頻的字元對合併為新的 Token
  4. 重複:直到達到預設的詞彙表大小

例如,"lower" 這個詞在 BPE 處理後,可能是 "low" + "er" 兩個 Token,因為 "er" 是一個非常常見的英文後綴。

不同模型的分詞差異

各家 AI 公司使用不同的分詞器:

  • GPT-4(OpenAI):使用 cl100k_base 分詞器,詞彙表約 10 萬個 Token
  • Claude 3(Anthropic):使用自家訓練的分詞器,對自然語言和程式碼都有良好支持
  • Gemini(Google):使用 SentencePiece 分詞器,支持多語言

這些分詞器的差異會導致相同的文本在不同模型中產生不同數量的 Token。例如,一段 100 字的中文文本: - GPT-4:約 150-200 Token - Claude 3:約 120-170 Token - Gemini:約 130-180 Token

各模型 Token 定價比較

2026 年主流 AI API 定價

模型 輸入 Token (每百萬) 輸出 Token (每百萬) 上下文窗口
GPT-4o $2.50 $10.00 128K
GPT-4o mini $0.15 $0.60 128K
Claude Opus 4 $15.00 $75.00 200K
Claude Sonnet 4 $3.00 $15.00 200K
Claude Haiku 3.5 $0.80 $4.00 200K
Gemini 2.0 Pro $1.25 $5.00 1M
Gemini 2.0 Flash $0.075 $0.30 1M

成本計算公式

API 成本 = (輸入 Token × 輸入價格) + (輸出 Token × 輸出價格)

例如,使用 Claude Sonnet 4 處理一個包含 2000 Token 輸入、500 Token 輸出的請求:

成本 = (2000 / 1,000,000 × $3.00) + (500 / 1,000,000 × $15.00)
     = $0.006 + $0.0075
     = $0.0135(約 NT$0.44)

實戰:Token 估算技巧

快速估算法則

英文: - 1 個單詞 ≈ 1.3 Token - 1 個句子 ≈ 15-25 Token - 1 頁 A4(500 字)≈ 650 Token

中文: - 1 個字 ≈ 1.5-2 Token - 1 個句子 ≈ 20-40 Token - 1 頁 A4(800 字)≈ 1200-1600 Token

程式碼: - 1 行程式碼 ≈ 5-15 Token - 100 行 Python ≈ 800-1200 Token - 100 行 JSON ≈ 400-600 Token

多語言 Token 差異

不同語言的 Token 效率差異很大:

語言 100 字的 Token 數(約) 效率排名
英文 130 1
西班牙文 150 2
法文 160 3
日文 180 4
中文 190 5
韓文 200 6
阿拉伯文 220 7

這是因為 BPE 分詞器的訓練資料以英文為主,對非拉丁語系的壓縮效率較低。

API 成本優化策略

1. 精簡 Prompt 設計

避免冗餘的指令。比較以下兩個 Prompt:

冗長版(約 80 Token)

你是一個非常有經驗的、專業的、頂級的翻譯專家。我希望你能夠幫助我把下面的這段中文文字翻譯成英文,翻譯的時候請注意語法正確、語意通順、符合英文母語者的表達習慣。

精簡版(約 20 Token)

翻譯成英文,保持自然語感:

兩者效果相似,但 Token 消耗差 4 倍。

2. 選擇合適的模型

  • 簡單任務(分類、摘要、格式轉換)→ 用小模型(GPT-4o mini、Haiku)
  • 複雜推理(程式碼生成、多步驟分析)→ 用大模型(GPT-4o、Sonnet)
  • 創意寫作(故事、行銷文案)→ 用最強模型(Opus)

3. 快取與批次處理

  • Prompt Caching:OpenAI 和 Anthropic 都支持 Prompt 快取,重複的 system prompt 可享 50-90% 折扣
  • Batch API:非即時任務使用批次處理,通常可享 50% 折扣
  • 本地快取:相同查詢結果緩存,避免重複呼叫

4. 上下文管理

  • 及時清理對話歷史中不再需要的訊息
  • 使用摘要替代完整歷史
  • 只保留最近 N 輪對話

常見問題 FAQ

Q:為什麼同一段文字在不同模型中 Token 數不同?

A:因為每個模型使用不同的分詞器和詞彙表。即使是同一家公司的不同版本模型,分詞結果也可能不同。

Q:程式碼的 Token 效率如何?

A:程式碼的 Token 效率取決於語言。Python 因為語法簡潔,Token 效率較高;JSON 和 XML 因為大量重複的結構標記,Token 效率較低。

Q:如何估算圖片的 Token 成本?

A:GPT-4V 的圖片 Token 取決於解析度:低解析度固定 85 Token,高解析度按 512×512 瓦片計算,每片 170 Token。Claude 的圖片 Token 計算方式類似但數值不同。

Q:免費的 Token 計算工具推薦?

A:Super Tools 提供免費的 AI Token 估算工具,支持 GPT-4、Claude 3、Gemini 等主流模型,可同時計算 Token 數量和預估成本。

Q:如何減少中文的 Token 消耗?

A:可以考慮以下方法: 1. 去除不必要的標點符號和空白 2. 使用簡潔的表達方式 3. 對於系統提示詞,考慮用英文撰寫(Token 更省) 4. 利用 Prompt Caching 減少重複消耗

結語

掌握 Token 計算是有效使用 AI API 的關鍵技能。透過理解 BPE 分詞原理、各模型的定價結構、以及成本優化策略,你可以在保持 AI 應用品質的同時,大幅降低 API 開支。建議使用 Super Tools 的 AI Token 計算工具,在開發前精準估算成本,避免帳單超出預期。