19 至 29 分鐘
,

Claude Code 付了 20 美金一個月,結果它連你的 codebase 都看不完。

這不是誇張。任何寫過 5 萬行以上專案的人都知道——打開 Claude Code,叫它「幫我找出所有處理登入驗證的地方」,它會乖乖地 grep 一輪關鍵字,然後告訴你「好像是這幾個檔案」,漏掉一半真正的命中。不是 Claude 笨,是它根本沒把整個專案塞進 context window。

2026 年 4 月 22 日,Zilliz(Milvus 向量資料庫背後那家公司)悄悄在 GitHub 推了一個叫 claude-context 的 MCP(Model Context Protocol)插件。沒有部落格公告,沒有 Demo Day,沒有 CEO 在 X 上開線。就只是一個 README、一行 npm install、加一個 VS Code 延伸套件。

24 小時後,它在 GitHub +871 stars。現在總星數衝到 8,100。

它幹的事只有一件:讓 Claude Code 真的能「看完」整個專案,而不是每次都盲目猜幾個檔案。

這篇文章來把它拆開講清楚——裝起來要花幾分鐘、能省多少錢、哪些人真的該裝、哪些人先別碰。

(截至 2026 年 4 月 23 日,版本為 @zilliz/claude-context-mcp 最新穩定版。)

claude-context 到底在解什麼痛點

用 Claude Code、Cursor、Windsurf 這類 AI 編輯器的人,應該都踩過同一個坑——

你叫它「重構 authentication flow」,它看了三個檔案就停下來生代碼。你提醒它「還有 /apps/api/auth-v2/ 那邊也要改」,它說「抱歉我沒看到」。你把路徑丟給它,它又只讀那三個檔案,忘了另外兩個跟 JWT 有關的 middleware 在哪。

本質是:Claude 的 context window 雖然大(200K tokens),但對一個 10 萬行的專案來說還是塞不下。於是 Claude Code 只能做簡化版的 grep——抓關鍵字、讀幾個檔案、祈禱抓對。

claude-context 做的事就是把這個邏輯升級兩個檔次:

  1. 把整個專案先建索引:用 AST 把代碼切成有意義的 chunk(一個函式、一個 class),而不是按行數亂切。
  2. 存進向量資料庫:每個 chunk 轉成 embedding,丟進 Milvus 或 Zilliz Cloud。以後你問 Claude 問題時,它先去向量庫找「意思相關」的代碼,而不是只找字面一樣的。
  3. 混合搜索:同時用 BM25(傳統關鍵字)和 dense vector(語意相似),兩邊結果加權合併。所以你問「處理登入驗證的函式」,即使代碼裡寫的是 validateSession 而不是 authLogin,它也能找到。

這不是什麼新發明。在 AI coding 圈,這個套路叫 Retrieval-Augmented Generation for Code(代碼版 RAG)。Cursor 內建就有類似東西,GitHub Copilot 企業版也有。

但 claude-context 的差異在於:它把這套東西做成 MCP,可以插到任何支援 MCP 的客戶端。不只 Claude Code,Cursor、Windsurf、VS Code、Cline、Gemini CLI、Codex CLI 都能用同一套索引。你建一次,所有 AI 工具共享。

40% token 減少代表什麼

Zilliz 在 README 裡放了一個數字:在維持同等檢索品質的前提下,claude-context 能減少約 40% 的 token 消耗。

先別跳過這行。對照 Claude Code 目前的 API 定價(Sonnet 4 約 $3/M input、$15/M output),這個數字對重度使用者的意義是:

使用情境沒用 claude-context用了 claude-context月省
個人開發者(每天 2 小時 vibe coding)約 $80-120約 $48-72$32-48
全職工程師(全天用 Claude Code)約 $300-500約 $180-300$120-200
小團隊(5 人)約 $1,500-2,500約 $900-1,500$600-1,000

這個估算有個前提:你本來就在燒 API credits 而不是用 Pro 訂閱的定額。如果你是用 Claude Max($200/月定額),那省的是「跑得更快、塞得下更大的專案」,而不是鈔票。

但對用 API 的重度開發者——也就是會花幾百到幾千美金在 coding agent 上的那批人——40% 就是真金白銀。

三分鐘把它裝起來(Claude Code 範例)

以 Claude Code 為例。假設你已經有 Claude Code 本體,整個流程是這樣:

Step 1:準備向量資料庫(免費路線)

最省錢的做法是用 Zilliz Cloud 的 Free Tier,註冊後拿一個免費的 cluster(1M 向量內免費,夠個人專案用)。拿到 URIToken 就好。

怕上雲的話可以本地跑 Milvus,docker compose 一鍵起。但除非你真的很介意代碼 embedding 跑到雲端,不然 Zilliz Cloud Free Tier 比較省事。

Step 2:準備 embedding provider

claude-context 支援四個 provider:

  • OpenAItext-embedding-3-small,預設選項,最通用)
  • VoyageAIvoyage-code-3,對代碼最精準,但要另外申請)
  • Ollama(完全本地跑,免費但需要顯卡)
  • Geminigemini-embedding,Google 家生態用戶最方便)

沒特別偏好就先用 OpenAI,拿 API key 貼進去就能跑。重度代碼搜索建議上 VoyageAI 的 voyage-code-3,實測對 code chunk 的語意理解最穩。

Step 3:在 Claude Code 註冊 MCP server

打開 Claude Code 的 MCP 設定檔(~/.claude/mcp_servers.json 或透過 /mcp add 指令),加一段:

{
  "mcpServers": {
    "claude-context": {
      "command": "npx",
      "args": ["-y", "@zilliz/claude-context-mcp@latest"],
      "env": {
        "OPENAI_API_KEY": "sk-...",
        "MILVUS_ADDRESS": "https://你的zilliz-cluster.com",
        "MILVUS_TOKEN": "你的token"
      }
    }
  }
}

重啟 Claude Code,在 /mcp 列表會看到 claude-context。接著在你的專案根目錄下一個指令:

/claude-context index

它會掃整個 repo、切 chunk、建 embedding、寫進向量庫。10 萬行的專案大概 2-5 分鐘跑完(看 API 速率限制)。以後 Claude Code 問任何問題,都會先查這個向量庫。

而且它用 Merkle tree 做增量更新——你改了幾個檔案,下次只重建那幾個 chunk 的 embedding,不會整個重跑。

以前 vs 現在:實際感受差多少

給一個具體場景。專案是一個中型 Next.js 應用,約 8 萬行,大概 1,200 個檔案。

任務沒裝 claude-context裝了 claude-context
「找出所有驗證使用者身份的地方」grep 4-5 輪、漏 30% 命中、來回追問一次列出 12 個相關檔案,含 middleware、API route、hook
「哪些地方用到 stripe webhook」只找到 /api/webhook,漏掉 test 資料夾的 mock直接列完,包含 fixture 和 e2e test
「重構整個錯誤處理流程」要手動把檔案貼給它,經常超過 context limit它自己先檢索 relevant chunks,一次吃得下
跨專案搜尋(多 monorepo package)基本不 work同一個 index 可以涵蓋所有 package

這不是魔法,是語意搜索 + 代碼結構切片該做的事。Cursor 早就內建類似能力,只是它綁自家 UI。claude-context 的價值是把這種能力解耦成一個 MCP server,讓你在任何客戶端都能用。

支援的 AI 客戶端:幾乎全部主流 coding agent

這是 claude-context 另一個被低估的點。官方列的客戶端清單包含:

  • Claude Code、Claude Desktop
  • Cursor、Windsurf
  • VS Code(透過延伸套件)
  • Cline、Void、Roo Code
  • Cherry Studio
  • Gemini CLI、Codex CLI、Qwen Code
  • Augment、Zencoder
  • 其他任何支援 MCP 的客戶端

換句話說,你今天用 Claude Code,明天換 Cursor,後天公司規定只能用 Gemini CLI——索引資料還是同一份,不用重建。對團隊來說這件事意義不小。

哪些人真的該裝、哪些人先別碰

該裝

  • 專案超過 5 萬行的全職工程師——context window 根本塞不下,語意搜索直接加槓桿
  • 用 API credits 付錢的重度用戶——40% token 減少直接換算成鈔票
  • 在多個 AI coding 工具之間跳來跳去的人——一份索引所有地方用
  • 寫 monorepo 的團隊——跨 package 檢索的體驗差距最大

先別碰

  • 專案小於 1 萬行——根本不需要,Claude Code 原生的檔案瀏覽就夠了
  • 用 Pro/Max 定額訂閱而不是 API——省的是 rate limit 不是錢,體感沒那麼大
  • 對 code 上雲超敏感的企業——可以跑本地 Milvus + Ollama,但配置會複雜很多
  • 已經在用 Cursor 的內建索引——功能高度重疊,沒必要雙重建

一個值得留意的趨勢

claude-context 本身不是革命性的東西。Cursor 兩年前就有類似功能,VoyageAI 的 code embedding model 也出了一段時間。真正的變化在於:MCP 把這些能力標準化了

2024 年底 Anthropic 推出 MCP 時,大家都覺得這只是另一個 plugin 標準,沒什麼大不了。18 個月後的今天,claude-context 只是最新一個案例——整個 AI coding 生態在把「搜索、記憶、工具調用」這些本來被各家鎖在自家 UI 裡的能力,拆成可組合的小模組。

對開發者的意義:你不用被綁在單一 AI 編輯器。你建一次 code index,切換哪個客戶端都能用;你寫一個 MCP,全世界 AI 工具都能叫;你訓練一份 memory,跨 session 都記得住。

這比「Claude 又多一個功能」值錢太多。

結論

如果你每天花 2 小時以上在 AI coding,用 Claude Code 或 Cursor 寫中大型專案,claude-context 值得你今晚花 30 分鐘裝起來。省下來的 token 費和找不到相關代碼的挫折感,兩週內就能回本。

如果你只是偶爾用 AI 寫寫小腳本,這個東西對你意義不大,先關起來。

GitHub repo:github.com/zilliztech/claude-context。MIT license,沒有什麼好猶豫的。

免責聲明:本文為技術工具介紹與使用心得分享,不構成任何投資建議。API 費用估算基於 2026 年 4 月的公開定價,實際費用視使用量而定。安裝前請詳讀 repo 的 security 章節,尤其是把代碼上傳雲端向量庫前的評估。

關於Mr. Slash

「Mr. Slash 的系統性人生」,創立於 2024年,由 Mr. Slash 本人及專業編輯團隊經營的財經內容平台。

我們的宗旨是透過投資、財經、自動化與新興科技等領域的深入解說與應用,幫助讀者打造穩定的被動收入系統。內容涵蓋加密貨幣、股息資產、量化工具、平台分潤等實用策略,協助你用更聰明的方法配置資金、累積資產,走在財務自由的路上,少走冤枉路。

若為商業合作邀稿,將會清楚標註「不代表本站立場」。

商業合作

如果您有任何關於我們團隊或網站內容的疑問或建議,歡迎您前往IG 私訊 @slash.Capital聯繫我們,謝謝!

發表迴響

Trending

探索更多來自 Mr. Slash|系統流人生 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Join Mr. Slash