用 AI 寫程式這一年,最痛的不是它寫不出來,是帳單。你叫它做一個稍微複雜點的功能,它在背後「想」很久,一來一回燒掉一大把 token,月底看 API 帳單才心痛。所以這個月當月之暗面(Moonshot AI)丟出 Kimi K2.7-Code,最讓我注意的不是它又多強,而是官方那句:推理用掉的 token 比上一代少了三成。
這是一個開源、可商用、專門拿來寫程式的大模型,6 月 12 日才把權重丟上 Hugging Face。對天天用 AI 寫東西的人來說,這種東西比那些只能在官網試玩的封閉模型實在得多。這篇就講清楚它是什麼、數據能不能信、值不值得你去試。
(截至 2026 年 6 月,Kimi K2.7-Code 採 Modified MIT 授權,權重已上 Hugging Face,可商用,大規模部署需標註出處。)
一句話:一個免費、能自己寫程式、還比較省的國產大模型
Kimi K2.7-Code 是月之暗面 Kimi K2.6 的接班人,定位很明確,就是衝著「AI 寫程式」這件事去做。它是一個混合專家(MoE)架構的模型,總參數 1 兆,但每處理一個 token 只啟動其中 320 億。簡單講,它腦袋很大,但每次只用上需要的那一小塊,所以跑起來沒有你想像中那麼貴。
幾個數字先擺出來:384 個專家、每個 token 挑 8 個用、外加 1 個共享專家;上下文視窗 256K token,差不多能一口氣塞進一個中型專案的程式碼。對寫程式來說,上下文夠長很關鍵,它能記得住整個專案的脈絡,而不是改 A 檔案就忘了 B 檔案怎麼寫。
真正的賣點不是更聰明,是更省
月之暗面這次主打的,就是省。官方說 K2.7-Code 比上一代少用三成的推理 token。這句話聽起來技術,但翻成白話就是:同一個任務,它想得更有效率,少走冤枉路,你的 API 帳單跟著變薄。
對個人開發者跟小團隊,這比多一兩分 benchmark 分數有感得多。寫程式的 AI 真正卡住很多人的,從來不是能力天花板,是成本地板。
至於它到底進步多少,官方給的是跟前一代 K2.6 的對比:Kimi Code Bench v2 上提升 21.8%、Program Bench 提升 11%、MLS Bench Lite 提升 31.5%。數字看起來很漂亮,但這裡我得幫你踩一下煞車。
潑盆冷水:這些數據,全是它自己考自己
到目前為止,K2.7-Code 公布的所有成績,用的都是月之暗面自家的考卷——Kimi Code Bench v2、Program Bench、MLS Bench Lite,這些都是它自己出題、自己評分。業界常用、大家拿來互相比較的那幾把公開尺,像 SWE-bench Verified、SWE-bench Pro、Terminal-Bench,到現在還沒有獨立第三方跑出 K2.7 的數字。
我不是說它造假。自己出 benchmark 在這行很常見,新模型剛發布、第三方還來不及測也正常。我只是提醒你:「比上一代強 21.8%」這種話,在獨立數據出來之前,當參考就好,別當定論。真正能說服我的,是過幾週社群拿它跑真實專案、跑公開榜單之後的結果。
好在它的上一代 K2.6 是有公開數據撐腰的,可以拿來推測 K2.7 的底子。K2.6 在 SWE-bench Verified 拿 80.2%,緊咬著 Claude Opus 4.6 的 80.8%;在更難的 SWE-bench Pro 上甚至以 58.6 反超了一票封閉模型。如果 K2.7 真的在這基礎上又往前走,那它的實力是不容小看的。
跟你現在可能在用的模型比,差在哪
| 面向 | Kimi K2.7-Code | 封閉模型(Claude / GPT 類) |
|---|---|---|
| 授權 | 開源可商用(Modified MIT) | 閉源,只能用官方 API |
| 權重 | 可自行下載部署 | 拿不到,資料得送上雲 |
| 定位 | 專攻寫程式 / Agent | 通用,寫程式只是其中一項 |
| 成本 | 主打省 token、可自架壓低成本 | 按官方定價走,較難議價 |
| 接入 | 相容 OpenAI 與 Anthropic SDK | 各家自己的 SDK |
這張表最值錢的一行是「相容 OpenAI 與 Anthropic SDK」。意思是你原本拿 GPT 或 Claude 寫好的程式,理論上把網址跟 key 換一換就能改用 Kimi,幾乎不用重寫。這大幅降低了「試一試」的成本,也是開源模型現在最會打的一張牌:我免費、我可商用、我還讓你無痛搬家。
你現在就能怎麼試
- 最快的方法是走月之暗面官方 API,或它的 Kimi Code 服務,付費但免安裝,幾分鐘就能接上你現有的工具。
- 想自己掌控成本或資料,就去 Hugging Face 抓開源權重自行部署。前提是你得有夠力的硬體,1 兆參數不是隨便一張顯卡跑得動的。
- 因為它相容 OpenAI / Anthropic SDK,你在 Cursor、Claude Code 這類工具裡,把模型端點指過去就能換它來跑,先拿一個小專案試水溫。
給普通人的提醒:你不用真的去下載那 1 兆參數的權重,那是給有伺服器的人玩的。一般人就走 API,把它當成另一個可選的「寫程式大腦」,跟你現在用的對比一下答案品質跟花費就好。
我的看法:開源這條路,越走越像在追封閉模型的尾燈
把時間拉長看,K2.7-Code 真正的意義不在這一個版本多強,而在節奏。月之暗面從 K2.6 到 K2.7-Code,中間只隔了兩個月,每次都把權重免費丟出來、都允許商用。這種出招頻率,正在把「最強的寫程式 AI 只能花錢租」這個前提慢慢拆掉。
對散戶跟小團隊,這是好事。你多了一個不被單一廠商綁死的選項,成本有了往下談的籌碼。但也別把開源神化。封閉模型還是有它的整合度、穩定度跟生態優勢,K2.7 自家 benchmark 漂亮歸漂亮,第三方數據沒出來前,我不會勸你立刻把主力切過去。
結論很簡單:花一個下午,拿你手上正在做的小專案,分別丟給你現在用的模型跟 Kimi K2.7-Code,比答案、比速度、比花費。它免費、可商用、還主打省 token,這個試錯成本低到沒有不試的理由。至於要不要轉正,等它經得起別人考卷的檢驗再說。
本文為 AI 工具教學與分享,不構成任何投資或專業技術建議。AI 模型版本、授權條款與性能數據更新極快,benchmark 數字目前多為官方自評,實際使用請以 Hugging Face 與月之暗面官方最新說明為準。





發表迴響