截至 2026 年 6 月,本文資訊以官方 GitHub 倉庫為準。
你有沒有試過把一份 PDF 直接丟給 ChatGPT 或 Claude,結果它讀出來的東西東缺西漏,表格全亂、欄位錯位?問題通常不在 AI,而在你餵進去的格式太髒。微軟有個叫 MarkItDown 的小工具,這幾天又衝上 GitHub 熱榜,單日加了快兩千顆星,總數已經到 14 萬。它做的事只有一件:把你的 PDF、Word、Excel、PPT、甚至圖片,全部洗成 Markdown——也就是大型語言模型最容易讀懂的純文字格式。
聽起來不起眼,但這正是很多人用 AI 處理文件卡關的真正原因。今天這篇把它講清楚:它是什麼、為什麼有用、怎麼五分鐘上手,還有怎麼接進 Claude 讓 AI 直接讀你電腦裡的檔案。
一句話:它是 AI 的「文件翻譯機」
MarkItDown 是微軟 AutoGen 團隊開源的 Python 工具,採用 MIT 授權,免費商用都沒問題。它的定位很單純:把各種格式的檔案轉成 Markdown,而且盡量保留原本的結構,標題、清單、表格、連結都會留著,不會洗成一團糊掉的文字。
為什麼要轉成 Markdown?因為 LLM 吃 token,格式越乾淨、結構越清楚,AI 理解得越準、花的 token 越少。PDF 內部其實是一堆排版指令,不是給機器讀的;Excel 的儲存格、PPT 的版面也一樣。MarkItDown 的工作就是把這些「給人看的排版」翻成「給 AI 看的純文字」。
它能吃下哪些格式
官方支援的格式範圍蠻廣,常見的辦公文件幾乎都涵蓋了:
| 類型 | 支援格式 |
|---|---|
| 辦公文件 | Word、PowerPoint、Excel |
| 一般 PDF(含文字與表格) | |
| 圖片 | 可抽 EXIF、可接 OCR 與圖片描述 |
| 音訊 | 抽 metadata,可接語音轉文字 |
| 網頁與資料 | HTML、CSV、JSON、XML |
| 壓縮檔 | ZIP(會自動逐一拆開處理) |
它最常被拿來跟 textract 比較,差別在於 MarkItDown 更在意「結構保留」。textract 把東西抽出來常常是一坨純文字,MarkItDown 會盡量把表格還原成 Markdown 表格、把標題還原成標題。對後面要餵 AI 或做 RAG(檢索增強生成)來說,這個差別很關鍵。
五分鐘上手
環境要求 Python 3.10 以上。裝起來只要一行:
pip install 'markitdown[all]'
那個 [all] 是把所有格式的依賴一次裝齊,省得之後缺東西。轉一份檔案也是一行命令:
markitdown 報告.pdf > 報告.md
如果你想寫進自己的腳本,用 Python 也很直接:
from markitdown import MarkItDown
md = MarkItDown()
result = md.convert("報告.pdf")
print(result.text_content)
就這樣。轉完的 Markdown 你可以直接複製貼到 ChatGPT、Claude,或存成檔案餵給你自己的 AI 流程。
進階玩法:接進 Claude,讓 AI 直接讀你的檔案
這才是我覺得最值得寫的部分。MarkItDown 有官方的 MCP server(Model Context Protocol,簡單講就是讓 AI 工具能調用外部能力的標準介面)。裝好之後,Claude Desktop 可以在對話中直接幫你把本機文件轉成 Markdown 再讀,不用你先手動轉一遍。
pip install markitdown-mcp
然後在 Claude Desktop 的設定檔 claude_desktop_config.json 裡把這個 server 加進去,重啟 Claude,它就多了「讀本機文件」這個本事。Word、PPT、Excel 都吃得下。對天天要整理合約、財報、研究報告的人來說,這一步省下的時間相當可觀——你不用再一個個複製貼上,直接叫 Claude「幫我看這份 PDF」就行。
它不是萬能的,這幾點要先知道
用過一輪,我的真實感受是:它在「結構單純的文件」上表現很穩,但碰到複雜排版會露餡。掃描版 PDF(純圖片、沒有文字層)要自己接 OCR,不接的話只會拿到一片空白。版面很花的 PPT、合侵儲存格很多的 Excel,轉出來偺爾會錯位,轉完最好還是掃一眼。
想要更高品質的轉換,官方支援接 Azure Content Understanding,可以做結構化欄位抽取和多模態處理,但那要花錢、也要設定,散戶玩家用免費版本通常就夠了。
| 面向 | 評價 |
|---|---|
| 價格 | 完全免費、開源 MIT 授權 |
| 上手難度 | 低,會用命令列就行 |
| 結構保留 | 好,明顯優於 textract |
| 掃描 PDF | 要自己接 OCR |
| 複雜排版 | 偶有錯位,需人工檢查 |
誰該裝、誰可以略遏
如果你常常要把文件餵終 AI——做研究、整理財報、搭 RAG 知識庫、批量處理一堆檔案——這工具基本上是必裝。它把「清洗格式」這個又煩又重複的步驟做成一行指令,省下的是真金白銀的 token 和時間。
反過來,如果你只是偶爾丟一份兩份檔案給 ChatGPT,其實不裝也行,直接上傳通常夠用。MarkItDown 真正的價值在「量」——當你要處理的是幾十、幾百份文件,或是要把它接進自動化流程的時候,它的威力才出得來。
很多人以為 AI 讀不懂文件是 AI 的問題,其實一大半是餵進去的格式太髒。先把格式洗乾淨,你會發現同一個 AI 突然變聰明了。
結論
MarkItDown 不花俏,它就是把一件小事做到位:把人看的文件,翻成 AI 看的格式。免費、開源、一行裝好、還能接進 Claude。對任何認真想用 AI 處理文件的人,這是少數「裝了不會後悔」的工具。今天就叫 pip 一下試試看,拿你手邊最頭痛的那份 PDF 開刀。
免責聲明:本文為工具教學與個人使用心得,不構成任何投資或商業建議。AI 工具更新極快,實際功能與支援格式請以官方 GitHub 倉庫最新說明為準。





發表迴響