Claude Code 省下 40% token 費的秘密：Zilliz 悄悄推的這個 MCP 一夜爆 +871 stars

23 4 月, 2026

19 至 29 分鐘

Claude Code 付了 20 美金一個月，結果它連你的 codebase 都看不完。

這不是誇張。任何寫過 5 萬行以上專案的人都知道——打開 Claude Code，叫它「幫我找出所有處理登入驗證的地方」，它會乖乖地 grep 一輪關鍵字，然後告訴你「好像是這幾個檔案」，漏掉一半真正的命中。不是 Claude 笨，是它根本沒把整個專案塞進 context window。

2026 年 4 月 22 日，Zilliz（Milvus 向量資料庫背後那家公司）悄悄在 GitHub 推了一個叫 claude-context 的 MCP（Model Context Protocol）插件。沒有部落格公告，沒有 Demo Day，沒有 CEO 在 X 上開線。就只是一個 README、一行 npm install、加一個 VS Code 延伸套件。

24 小時後，它在 GitHub +871 stars。現在總星數衝到 8,100。

它幹的事只有一件：讓 Claude Code 真的能「看完」整個專案，而不是每次都盲目猜幾個檔案。

這篇文章來把它拆開講清楚——裝起來要花幾分鐘、能省多少錢、哪些人真的該裝、哪些人先別碰。

（截至 2026 年 4 月 23 日，版本為 @zilliz/claude-context-mcp 最新穩定版。）

claude-context 到底在解什麼痛點

用 Claude Code、Cursor、Windsurf 這類 AI 編輯器的人，應該都踩過同一個坑——

你叫它「重構 authentication flow」，它看了三個檔案就停下來生代碼。你提醒它「還有 /apps/api/auth-v2/ 那邊也要改」，它說「抱歉我沒看到」。你把路徑丟給它，它又只讀那三個檔案，忘了另外兩個跟 JWT 有關的 middleware 在哪。

本質是：Claude 的 context window 雖然大（200K tokens），但對一個 10 萬行的專案來說還是塞不下。於是 Claude Code 只能做簡化版的 grep——抓關鍵字、讀幾個檔案、祈禱抓對。

claude-context 做的事就是把這個邏輯升級兩個檔次：

把整個專案先建索引：用 AST 把代碼切成有意義的 chunk（一個函式、一個 class），而不是按行數亂切。
存進向量資料庫：每個 chunk 轉成 embedding，丟進 Milvus 或 Zilliz Cloud。以後你問 Claude 問題時，它先去向量庫找「意思相關」的代碼，而不是只找字面一樣的。
混合搜索：同時用 BM25（傳統關鍵字）和 dense vector（語意相似），兩邊結果加權合併。所以你問「處理登入驗證的函式」，即使代碼裡寫的是 validateSession 而不是 authLogin，它也能找到。

這不是什麼新發明。在 AI coding 圈，這個套路叫 Retrieval-Augmented Generation for Code（代碼版 RAG）。Cursor 內建就有類似東西，GitHub Copilot 企業版也有。

但 claude-context 的差異在於：它把這套東西做成 MCP，可以插到任何支援 MCP 的客戶端。不只 Claude Code，Cursor、Windsurf、VS Code、Cline、Gemini CLI、Codex CLI 都能用同一套索引。你建一次，所有 AI 工具共享。

40% token 減少代表什麼

Zilliz 在 README 裡放了一個數字：在維持同等檢索品質的前提下，claude-context 能減少約 40% 的 token 消耗。

先別跳過這行。對照 Claude Code 目前的 API 定價（Sonnet 4 約 $3/M input、$15/M output），這個數字對重度使用者的意義是：

使用情境	沒用 claude-context	用了 claude-context	月省
個人開發者（每天 2 小時 vibe coding）	約 $80-120	約 $48-72	$32-48
全職工程師（全天用 Claude Code）	約 $300-500	約 $180-300	$120-200
小團隊（5 人）	約 $1,500-2,500	約 $900-1,500	$600-1,000

這個估算有個前提：你本來就在燒 API credits 而不是用 Pro 訂閱的定額。如果你是用 Claude Max（$200/月定額），那省的是「跑得更快、塞得下更大的專案」，而不是鈔票。

但對用 API 的重度開發者——也就是會花幾百到幾千美金在 coding agent 上的那批人——40% 就是真金白銀。

三分鐘把它裝起來（Claude Code 範例）

以 Claude Code 為例。假設你已經有 Claude Code 本體，整個流程是這樣：

Step 1：準備向量資料庫（免費路線）

最省錢的做法是用 Zilliz Cloud 的 Free Tier，註冊後拿一個免費的 cluster（1M 向量內免費，夠個人專案用）。拿到 URI 和 Token 就好。

怕上雲的話可以本地跑 Milvus，docker compose 一鍵起。但除非你真的很介意代碼 embedding 跑到雲端，不然 Zilliz Cloud Free Tier 比較省事。

Step 2：準備 embedding provider

claude-context 支援四個 provider：

OpenAI（text-embedding-3-small，預設選項，最通用）
VoyageAI（voyage-code-3，對代碼最精準，但要另外申請）
Ollama（完全本地跑，免費但需要顯卡）
Gemini（gemini-embedding，Google 家生態用戶最方便）

沒特別偏好就先用 OpenAI，拿 API key 貼進去就能跑。重度代碼搜索建議上 VoyageAI 的 voyage-code-3，實測對 code chunk 的語意理解最穩。

Step 3：在 Claude Code 註冊 MCP server

打開 Claude Code 的 MCP 設定檔（~/.claude/mcp_servers.json 或透過 /mcp add 指令），加一段：

{
  "mcpServers": {
    "claude-context": {
      "command": "npx",
      "args": ["-y", "@zilliz/claude-context-mcp@latest"],
      "env": {
        "OPENAI_API_KEY": "sk-...",
        "MILVUS_ADDRESS": "https://你的zilliz-cluster.com",
        "MILVUS_TOKEN": "你的token"
      }
    }
  }
}

重啟 Claude Code，在 /mcp 列表會看到 claude-context。接著在你的專案根目錄下一個指令：

/claude-context index

它會掃整個 repo、切 chunk、建 embedding、寫進向量庫。10 萬行的專案大概 2-5 分鐘跑完（看 API 速率限制）。以後 Claude Code 問任何問題，都會先查這個向量庫。

而且它用 Merkle tree 做增量更新——你改了幾個檔案，下次只重建那幾個 chunk 的 embedding，不會整個重跑。

以前 vs 現在：實際感受差多少

給一個具體場景。專案是一個中型 Next.js 應用，約 8 萬行，大概 1,200 個檔案。

任務	沒裝 claude-context	裝了 claude-context
「找出所有驗證使用者身份的地方」	grep 4-5 輪、漏 30% 命中、來回追問	一次列出 12 個相關檔案，含 middleware、API route、hook
「哪些地方用到 stripe webhook」	只找到 `/api/webhook`，漏掉 test 資料夾的 mock	直接列完，包含 fixture 和 e2e test
「重構整個錯誤處理流程」	要手動把檔案貼給它，經常超過 context limit	它自己先檢索 relevant chunks，一次吃得下
跨專案搜尋（多 monorepo package）	基本不 work	同一個 index 可以涵蓋所有 package

這不是魔法，是語意搜索 + 代碼結構切片該做的事。Cursor 早就內建類似能力，只是它綁自家 UI。claude-context 的價值是把這種能力解耦成一個 MCP server，讓你在任何客戶端都能用。

支援的 AI 客戶端：幾乎全部主流 coding agent

這是 claude-context 另一個被低估的點。官方列的客戶端清單包含：

Claude Code、Claude Desktop
Cursor、Windsurf
VS Code（透過延伸套件）
Cline、Void、Roo Code
Cherry Studio
Gemini CLI、Codex CLI、Qwen Code
Augment、Zencoder
其他任何支援 MCP 的客戶端

換句話說，你今天用 Claude Code，明天換 Cursor，後天公司規定只能用 Gemini CLI——索引資料還是同一份，不用重建。對團隊來說這件事意義不小。

哪些人真的該裝、哪些人先別碰

該裝

專案超過 5 萬行的全職工程師——context window 根本塞不下，語意搜索直接加槓桿
用 API credits 付錢的重度用戶——40% token 減少直接換算成鈔票
在多個 AI coding 工具之間跳來跳去的人——一份索引所有地方用
寫 monorepo 的團隊——跨 package 檢索的體驗差距最大

先別碰

專案小於 1 萬行——根本不需要，Claude Code 原生的檔案瀏覽就夠了
用 Pro/Max 定額訂閱而不是 API——省的是 rate limit 不是錢，體感沒那麼大
對 code 上雲超敏感的企業——可以跑本地 Milvus + Ollama，但配置會複雜很多
已經在用 Cursor 的內建索引——功能高度重疊，沒必要雙重建

一個值得留意的趨勢

claude-context 本身不是革命性的東西。Cursor 兩年前就有類似功能，VoyageAI 的 code embedding model 也出了一段時間。真正的變化在於：MCP 把這些能力標準化了。

2024 年底 Anthropic 推出 MCP 時，大家都覺得這只是另一個 plugin 標準，沒什麼大不了。18 個月後的今天，claude-context 只是最新一個案例——整個 AI coding 生態在把「搜索、記憶、工具調用」這些本來被各家鎖在自家 UI 裡的能力，拆成可組合的小模組。

對開發者的意義：你不用被綁在單一 AI 編輯器。你建一次 code index，切換哪個客戶端都能用；你寫一個 MCP，全世界 AI 工具都能叫；你訓練一份 memory，跨 session 都記得住。

這比「Claude 又多一個功能」值錢太多。

結論

如果你每天花 2 小時以上在 AI coding，用 Claude Code 或 Cursor 寫中大型專案，claude-context 值得你今晚花 30 分鐘裝起來。省下來的 token 費和找不到相關代碼的挫折感，兩週內就能回本。

如果你只是偶爾用 AI 寫寫小腳本，這個東西對你意義不大，先關起來。

GitHub repo：github.com/zilliztech/claude-context。MIT license，沒有什麼好猶豫的。

免責聲明：本文為技術工具介紹與使用心得分享，不構成任何投資建議。API 費用估算基於 2026 年 4 月的公開定價，實際費用視使用量而定。安裝前請詳讀 repo 的 security 章節，尤其是把代碼上傳雲端向量庫前的評估。

加入 Mr. Slash 免費社群

第一時間收到交易所獨家優惠、AI 工具推薦、和市場分析更新

立即加入 Telegram 社群

關於Ｍr. Slash

「Mr. Slash 的系統性人生」，創立於 2024年，由 Mr. Slash 本人及專業編輯團隊經營的財經內容平台。

我們的宗旨是透過投資、財經、自動化與新興科技等領域的深入解說與應用，幫助讀者打造穩定的被動收入系統。內容涵蓋加密貨幣、股息資產、量化工具、平台分潤等實用策略，協助你用更聰明的方法配置資金、累積資產，走在財務自由的路上，少走冤枉路。

若為商業合作邀稿，將會清楚標註「不代表本站立場」。

商業合作

如果您有任何關於我們團隊或網站內容的疑問或建議，歡迎您前往IG 私訊 @slash.Capital聯繫我們，謝謝！

Claude Code 省下 40% token 費的秘密：Zilliz 悄悄推的這個 MCP 一夜爆 +871 stars

claude-context 到底在解什麼痛點

40% token 減少代表什麼