AI Token 計算完全指南：精準掌握 API 成本

什麼是 Token？

在大型語言模型（LLM）的世界中，Token 是文本處理的最小單位。它不等同於一個字或一個詞，而是介於字元和詞之間的概念。理解 Token 的運作方式，是有效控制 AI API 成本的第一步。

Token 的基本概念

以英文為例，一個 Token 大約等於 4 個字元或 0.75 個單詞。常見的英文單詞如 "hello" 就是一個 Token，但較長的單詞如 "extraordinary" 可能會被拆分為 "extra" + "ordinary" 兩個 Token。

中文的情況則完全不同。由於中文字元的 Unicode 編碼較複雜，每個中文字通常需要 1-3 個 Token。這意味著同樣的語意內容，中文版本消耗的 Token 數量往往是英文的 1.5-2 倍。

BPE 分詞演算法解析

Byte Pair Encoding 原理

大多數主流 LLM 使用 BPE（Byte Pair Encoding） 分詞法。這是一種統計方法，通過反覆合併最常見的字元對來建立詞彙表。

BPE 的工作流程如下：

初始化：將所有文本拆分為單個字元
統計頻率：找出最常見的相鄰字元對
合併：將最高頻的字元對合併為新的 Token
重複：直到達到預設的詞彙表大小

例如，"lower" 這個詞在 BPE 處理後，可能是 "low" + "er" 兩個 Token，因為 "er" 是一個非常常見的英文後綴。

不同模型的分詞差異

各家 AI 公司使用不同的分詞器：

GPT-4（OpenAI）：使用 cl100k_base 分詞器，詞彙表約 10 萬個 Token
Claude 3（Anthropic）：使用自家訓練的分詞器，對自然語言和程式碼都有良好支持
Gemini（Google）：使用 SentencePiece 分詞器，支持多語言

這些分詞器的差異會導致相同的文本在不同模型中產生不同數量的 Token。例如，一段 100 字的中文文本： - GPT-4：約 150-200 Token - Claude 3：約 120-170 Token - Gemini：約 130-180 Token

各模型 Token 定價比較

2026 年主流 AI API 定價

模型	輸入 Token (每百萬)	輸出 Token (每百萬)	上下文窗口
GPT-4o	$2.50	$10.00	128K
GPT-4o mini	$0.15	$0.60	128K
Claude Opus 4	$15.00	$75.00	200K
Claude Sonnet 4	$3.00	$15.00	200K
Claude Haiku 3.5	$0.80	$4.00	200K
Gemini 2.0 Pro	$1.25	$5.00	1M
Gemini 2.0 Flash	$0.075	$0.30	1M

成本計算公式

API 成本 = (輸入 Token × 輸入價格) + (輸出 Token × 輸出價格)

例如，使用 Claude Sonnet 4 處理一個包含 2000 Token 輸入、500 Token 輸出的請求：

成本 = (2000 / 1,000,000 × $3.00) + (500 / 1,000,000 × $15.00)
     = $0.006 + $0.0075
     = $0.0135（約 NT$0.44）

實戰：Token 估算技巧

快速估算法則

英文： - 1 個單詞 ≈ 1.3 Token - 1 個句子 ≈ 15-25 Token - 1 頁 A4（500 字）≈ 650 Token

中文： - 1 個字 ≈ 1.5-2 Token - 1 個句子 ≈ 20-40 Token - 1 頁 A4（800 字）≈ 1200-1600 Token

程式碼： - 1 行程式碼 ≈ 5-15 Token - 100 行 Python ≈ 800-1200 Token - 100 行 JSON ≈ 400-600 Token

多語言 Token 差異

不同語言的 Token 效率差異很大：

語言	100 字的 Token 數（約）	效率排名
英文	130	1
西班牙文	150	2
法文	160	3
日文	180	4
中文	190	5
韓文	200	6
阿拉伯文	220	7

這是因為 BPE 分詞器的訓練資料以英文為主，對非拉丁語系的壓縮效率較低。

API 成本優化策略

1. 精簡 Prompt 設計

避免冗餘的指令。比較以下兩個 Prompt：

冗長版（約 80 Token）：

你是一個非常有經驗的、專業的、頂級的翻譯專家。我希望你能夠幫助我把下面的這段中文文字翻譯成英文，翻譯的時候請注意語法正確、語意通順、符合英文母語者的表達習慣。

精簡版（約 20 Token）：

翻譯成英文，保持自然語感：

兩者效果相似，但 Token 消耗差 4 倍。

2. 選擇合適的模型

簡單任務（分類、摘要、格式轉換）→ 用小模型（GPT-4o mini、Haiku）
複雜推理（程式碼生成、多步驟分析）→ 用大模型（GPT-4o、Sonnet）
創意寫作（故事、行銷文案）→ 用最強模型（Opus）

3. 快取與批次處理

Prompt Caching：OpenAI 和 Anthropic 都支持 Prompt 快取，重複的 system prompt 可享 50-90% 折扣
Batch API：非即時任務使用批次處理，通常可享 50% 折扣
本地快取：相同查詢結果緩存，避免重複呼叫

4. 上下文管理

及時清理對話歷史中不再需要的訊息
使用摘要替代完整歷史
只保留最近 N 輪對話

常見問題 FAQ

Q：為什麼同一段文字在不同模型中 Token 數不同？

A：因為每個模型使用不同的分詞器和詞彙表。即使是同一家公司的不同版本模型，分詞結果也可能不同。

Q：程式碼的 Token 效率如何？

A：程式碼的 Token 效率取決於語言。Python 因為語法簡潔，Token 效率較高；JSON 和 XML 因為大量重複的結構標記，Token 效率較低。

Q：如何估算圖片的 Token 成本？

A：GPT-4V 的圖片 Token 取決於解析度：低解析度固定 85 Token，高解析度按 512×512 瓦片計算，每片 170 Token。Claude 的圖片 Token 計算方式類似但數值不同。

Q：免費的 Token 計算工具推薦？

A：Super Tools 提供免費的 AI Token 估算工具，支持 GPT-4、Claude 3、Gemini 等主流模型，可同時計算 Token 數量和預估成本。

Q：如何減少中文的 Token 消耗？

A：可以考慮以下方法： 1. 去除不必要的標點符號和空白 2. 使用簡潔的表達方式 3. 對於系統提示詞，考慮用英文撰寫（Token 更省） 4. 利用 Prompt Caching 減少重複消耗

結語

掌握 Token 計算是有效使用 AI API 的關鍵技能。透過理解 BPE 分詞原理、各模型的定價結構、以及成本優化策略，你可以在保持 AI 應用品質的同時，大幅降低 API 開支。建議使用 Super Tools 的 AI Token 計算工具，在開發前精準估算成本，避免帳單超出預期。