截至 2026 年 6 月,本文資訊以官方 GitHub 倉庫為準。

你有沒有試過把一份 PDF 直接丟給 ChatGPT 或 Claude,結果它讀出來的東西東缺西漏,表格全亂、欄位錯位?問題通常不在 AI,而在你餵進去的格式太髒。微軟有個叫 MarkItDown 的小工具,這幾天又衝上 GitHub 熱榜,單日加了快兩千顆星,總數已經到 14 萬。它做的事只有一件:把你的 PDF、Word、Excel、PPT、甚至圖片,全部洗成 Markdown——也就是大型語言模型最容易讀懂的純文字格式。

聽起來不起眼,但這正是很多人用 AI 處理文件卡關的真正原因。今天這篇把它講清楚:它是什麼、為什麼有用、怎麼五分鐘上手,還有怎麼接進 Claude 讓 AI 直接讀你電腦裡的檔案。

一句話:它是 AI 的「文件翻譯機」

MarkItDown 是微軟 AutoGen 團隊開源的 Python 工具,採用 MIT 授權,免費商用都沒問題。它的定位很單純:把各種格式的檔案轉成 Markdown,而且盡量保留原本的結構,標題、清單、表格、連結都會留著,不會洗成一團糊掉的文字。

為什麼要轉成 Markdown?因為 LLM 吃 token,格式越乾淨、結構越清楚,AI 理解得越準、花的 token 越少。PDF 內部其實是一堆排版指令,不是給機器讀的;Excel 的儲存格、PPT 的版面也一樣。MarkItDown 的工作就是把這些「給人看的排版」翻成「給 AI 看的純文字」。

它能吃下哪些格式

官方支援的格式範圍蠻廣,常見的辦公文件幾乎都涵蓋了:

類型支援格式
辦公文件Word、PowerPoint、Excel
PDF一般 PDF(含文字與表格)
圖片可抽 EXIF、可接 OCR 與圖片描述
音訊抽 metadata,可接語音轉文字
網頁與資料HTML、CSV、JSON、XML
壓縮檔ZIP(會自動逐一拆開處理)

它最常被拿來跟 textract 比較,差別在於 MarkItDown 更在意「結構保留」。textract 把東西抽出來常常是一坨純文字,MarkItDown 會盡量把表格還原成 Markdown 表格、把標題還原成標題。對後面要餵 AI 或做 RAG(檢索增強生成)來說,這個差別很關鍵。

五分鐘上手

環境要求 Python 3.10 以上。裝起來只要一行:

pip install 'markitdown[all]'

那個 [all] 是把所有格式的依賴一次裝齊,省得之後缺東西。轉一份檔案也是一行命令:

markitdown 報告.pdf > 報告.md

如果你想寫進自己的腳本,用 Python 也很直接:

from markitdown import MarkItDown

md = MarkItDown()
result = md.convert("報告.pdf")
print(result.text_content)

就這樣。轉完的 Markdown 你可以直接複製貼到 ChatGPT、Claude,或存成檔案餵給你自己的 AI 流程。

進階玩法:接進 Claude,讓 AI 直接讀你的檔案

這才是我覺得最值得寫的部分。MarkItDown 有官方的 MCP server(Model Context Protocol,簡單講就是讓 AI 工具能調用外部能力的標準介面)。裝好之後,Claude Desktop 可以在對話中直接幫你把本機文件轉成 Markdown 再讀,不用你先手動轉一遍。

pip install markitdown-mcp

然後在 Claude Desktop 的設定檔 claude_desktop_config.json 裡把這個 server 加進去,重啟 Claude,它就多了「讀本機文件」這個本事。Word、PPT、Excel 都吃得下。對天天要整理合約、財報、研究報告的人來說,這一步省下的時間相當可觀——你不用再一個個複製貼上,直接叫 Claude「幫我看這份 PDF」就行。

它不是萬能的,這幾點要先知道

用過一輪,我的真實感受是:它在「結構單純的文件」上表現很穩,但碰到複雜排版會露餡。掃描版 PDF(純圖片、沒有文字層)要自己接 OCR,不接的話只會拿到一片空白。版面很花的 PPT、合侵儲存格很多的 Excel,轉出來偺爾會錯位,轉完最好還是掃一眼。

想要更高品質的轉換,官方支援接 Azure Content Understanding,可以做結構化欄位抽取和多模態處理,但那要花錢、也要設定,散戶玩家用免費版本通常就夠了。

面向評價
價格完全免費、開源 MIT 授權
上手難度低,會用命令列就行
結構保留好,明顯優於 textract
掃描 PDF要自己接 OCR
複雜排版偶有錯位,需人工檢查

誰該裝、誰可以略遏

如果你常常要把文件餵終 AI——做研究、整理財報、搭 RAG 知識庫、批量處理一堆檔案——這工具基本上是必裝。它把「清洗格式」這個又煩又重複的步驟做成一行指令,省下的是真金白銀的 token 和時間。

反過來,如果你只是偶爾丟一份兩份檔案給 ChatGPT,其實不裝也行,直接上傳通常夠用。MarkItDown 真正的價值在「量」——當你要處理的是幾十、幾百份文件,或是要把它接進自動化流程的時候,它的威力才出得來。

很多人以為 AI 讀不懂文件是 AI 的問題,其實一大半是餵進去的格式太髒。先把格式洗乾淨,你會發現同一個 AI 突然變聰明了。

結論

MarkItDown 不花俏,它就是把一件小事做到位:把人看的文件,翻成 AI 看的格式。免費、開源、一行裝好、還能接進 Claude。對任何認真想用 AI 處理文件的人,這是少數「裝了不會後悔」的工具。今天就叫 pip 一下試試看,拿你手邊最頭痛的那份 PDF 開刀。

免責聲明:本文為工具教學與個人使用心得,不構成任何投資或商業建議。AI 工具更新極快,實際功能與支援格式請以官方 GitHub 倉庫最新說明為準。

關於Mr. Slash

「Mr. Slash 的系統性人生」,創立於 2024年,由 Mr. Slash 本人及專業編輯團隊經營的財經內容平台。

我們的宗旨是透過投資、財經、自動化與新興科技等領域的深入解說與應用,幫助讀者打造穩定的被動收入系統。內容涵蓋加密貨幣、股息資產、量化工具、平台分潤等實用策略,協助你用更聰明的方法配置資金、累積資產,走在財務自由的路上,少走冤枉路。

若為商業合作邀稿,將會清楚標註「不代表本站立場」。

商業合作

如果您有任何關於我們團隊或網站內容的疑問或建議,歡迎您前往IG 私訊 @slash.Capital聯繫我們,謝謝!

發表迴響

相關文章

Trending

探索更多來自 Mr. Slash|系統流人生 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Join Mr. Slash