微軟悄悄做了個 14 萬星小工具：把 PDF、Excel、PPT 一鍵餵成 AI 看得懂的格式

4 6 月, 2026

截至 2026 年 6 月，本文資訊以官方 GitHub 倉庫為準。

你有沒有試過把一份 PDF 直接丟給 ChatGPT 或 Claude，結果它讀出來的東西東缺西漏，表格全亂、欄位錯位？問題通常不在 AI，而在你餵進去的格式太髒。微軟有個叫 MarkItDown 的小工具，這幾天又衝上 GitHub 熱榜，單日加了快兩千顆星，總數已經到 14 萬。它做的事只有一件：把你的 PDF、Word、Excel、PPT、甚至圖片，全部洗成 Markdown——也就是大型語言模型最容易讀懂的純文字格式。

聽起來不起眼，但這正是很多人用 AI 處理文件卡關的真正原因。今天這篇把它講清楚：它是什麼、為什麼有用、怎麼五分鐘上手，還有怎麼接進 Claude 讓 AI 直接讀你電腦裡的檔案。

一句話：它是 AI 的「文件翻譯機」

MarkItDown 是微軟 AutoGen 團隊開源的 Python 工具，採用 MIT 授權，免費商用都沒問題。它的定位很單純：把各種格式的檔案轉成 Markdown，而且盡量保留原本的結構，標題、清單、表格、連結都會留著，不會洗成一團糊掉的文字。

為什麼要轉成 Markdown？因為 LLM 吃 token，格式越乾淨、結構越清楚，AI 理解得越準、花的 token 越少。PDF 內部其實是一堆排版指令，不是給機器讀的；Excel 的儲存格、PPT 的版面也一樣。MarkItDown 的工作就是把這些「給人看的排版」翻成「給 AI 看的純文字」。

它能吃下哪些格式

官方支援的格式範圍蠻廣，常見的辦公文件幾乎都涵蓋了：

類型	支援格式
辦公文件	Word、PowerPoint、Excel
PDF	一般 PDF（含文字與表格）
圖片	可抽 EXIF、可接 OCR 與圖片描述
音訊	抽 metadata，可接語音轉文字
網頁與資料	HTML、CSV、JSON、XML
壓縮檔	ZIP（會自動逐一拆開處理）

它最常被拿來跟 textract 比較，差別在於 MarkItDown 更在意「結構保留」。textract 把東西抽出來常常是一坨純文字，MarkItDown 會盡量把表格還原成 Markdown 表格、把標題還原成標題。對後面要餵 AI 或做 RAG（檢索增強生成）來說，這個差別很關鍵。

五分鐘上手

環境要求 Python 3.10 以上。裝起來只要一行：

pip install 'markitdown[all]'

那個 [all] 是把所有格式的依賴一次裝齊，省得之後缺東西。轉一份檔案也是一行命令：

markitdown 報告.pdf > 報告.md

如果你想寫進自己的腳本，用 Python 也很直接：

from markitdown import MarkItDown

md = MarkItDown()
result = md.convert("報告.pdf")
print(result.text_content)

就這樣。轉完的 Markdown 你可以直接複製貼到 ChatGPT、Claude，或存成檔案餵給你自己的 AI 流程。

進階玩法：接進 Claude，讓 AI 直接讀你的檔案

這才是我覺得最值得寫的部分。MarkItDown 有官方的 MCP server（Model Context Protocol，簡單講就是讓 AI 工具能調用外部能力的標準介面）。裝好之後，Claude Desktop 可以在對話中直接幫你把本機文件轉成 Markdown 再讀，不用你先手動轉一遍。

pip install markitdown-mcp

然後在 Claude Desktop 的設定檔 claude_desktop_config.json 裡把這個 server 加進去，重啟 Claude，它就多了「讀本機文件」這個本事。Word、PPT、Excel 都吃得下。對天天要整理合約、財報、研究報告的人來說，這一步省下的時間相當可觀——你不用再一個個複製貼上，直接叫 Claude「幫我看這份 PDF」就行。

它不是萬能的，這幾點要先知道

用過一輪，我的真實感受是：它在「結構單純的文件」上表現很穩，但碰到複雜排版會露餡。掃描版 PDF（純圖片、沒有文字層）要自己接 OCR，不接的話只會拿到一片空白。版面很花的 PPT、合侵儲存格很多的 Excel，轉出來偺爾會錯位，轉完最好還是掃一眼。

想要更高品質的轉換，官方支援接 Azure Content Understanding，可以做結構化欄位抽取和多模態處理，但那要花錢、也要設定，散戶玩家用免費版本通常就夠了。

面向	評價
價格	完全免費、開源 MIT 授權
上手難度	低，會用命令列就行
結構保留	好，明顯優於 textract
掃描 PDF	要自己接 OCR
複雜排版	偶有錯位，需人工檢查

誰該裝、誰可以略遏

如果你常常要把文件餵終 AI——做研究、整理財報、搭 RAG 知識庫、批量處理一堆檔案——這工具基本上是必裝。它把「清洗格式」這個又煩又重複的步驟做成一行指令，省下的是真金白銀的 token 和時間。

反過來,如果你只是偶爾丟一份兩份檔案給 ChatGPT,其實不裝也行,直接上傳通常夠用。MarkItDown 真正的價值在「量」——當你要處理的是幾十、幾百份文件,或是要把它接進自動化流程的時候,它的威力才出得來。

很多人以為 AI 讀不懂文件是 AI 的問題,其實一大半是餵進去的格式太髒。先把格式洗乾淨,你會發現同一個 AI 突然變聰明了。

結論

MarkItDown 不花俏，它就是把一件小事做到位:把人看的文件,翻成 AI 看的格式。免費、開源、一行裝好、還能接進 Claude。對任何認真想用 AI 處理文件的人,這是少數「裝了不會後悔」的工具。今天就叫 pip 一下試試看,拿你手邊最頭痛的那份 PDF 開刀。

免責聲明:本文為工具教學與個人使用心得,不構成任何投資或商業建議。AI 工具更新極快,實際功能與支援格式請以官方 GitHub 倉庫最新說明為準。

延伸閱讀：站內相關文章

加入 Mr. Slash 免費社群

第一時間收到交易所獨家優惠、AI 工具推薦、和市場分析更新

立即加入 Telegram 社群

關於Ｍr. Slash

「Mr. Slash 的系統性人生」，創立於 2024年，由 Mr. Slash 本人及專業編輯團隊經營的財經內容平台。

我們的宗旨是透過投資、財經、自動化與新興科技等領域的深入解說與應用，幫助讀者打造穩定的被動收入系統。內容涵蓋加密貨幣、股息資產、量化工具、平台分潤等實用策略，協助你用更聰明的方法配置資金、累積資產，走在財務自由的路上，少走冤枉路。

若為商業合作邀稿，將會清楚標註「不代表本站立場」。

商業合作

如果您有任何關於我們團隊或網站內容的疑問或建議，歡迎您前往IG 私訊 @slash.Capital聯繫我們，謝謝！

عن Mr. Slash

«Mr. Slash» منصة محتوى مالي تأسست عام 2024، يديرها فريق تحرير متخصص. نقدّم للقارئ العربي شروحات عملية ومحايدة عن العملات الرقمية وطرق الشراء والإيداع والسحب المحلية في السعودية ومصر والخليج.

هدفنا مساعدتك على فهم السوق واختيار منصة تداول موثوقة وتقليل الرسوم. نحن لا نقدّم نصيحة استثمارية والقرار النهائي يبقى لك؛ وفي حال التعاون التجاري يُوضَّح ذلك صراحةً ولا يمثّل رأي الموقع.

تواصل وتعاون تجاري

لأي استفسار أو اقتراح أو تعاون، تواصل معنا عبر إنستغرام @slash.Capital. شكرًا لك!

發表迴響取消回覆

加密貨幣週報（7/20–7/26）：美債殖利率上行壓抑比特幣週跌約 3%，CLARITY Act 更新草案、以太坊相對抗跌與下週 FOMC 行事曆

美股一週速覽（7/20–7/24）：Alphabet、Tesla 財報重挫拖累那指週跌 2.1%，AI 資本支出成焦點

五大交易所本週活動精選｜2026/07/27

Trending

加密貨幣週報（7/20–7/26）：美債殖利率上行壓抑比特幣週跌約 3%，CLARITY Act 更新草案、以太坊相對抗跌與下週 FOMC 行事曆

美股一週速覽（7/20–7/24）：Alphabet、Tesla 財報重挫拖累那指週跌 2.1%，AI 資本支出成焦點

五大交易所本週活動精選｜2026/07/27

Chat2DB 是什麼？不會寫 SQL 也能用一句白話查資料庫：開源免費 AI 客戶端（2026 實測）

微軟悄悄做了個 14 萬星小工具：把 PDF、Excel、PPT 一鍵餵成 AI 看得懂的格式

一句話：它是 AI 的「文件翻譯機」

它能吃下哪些格式

五分鐘上手

進階玩法：接進 Claude，讓 AI 直接讀你的檔案

它不是萬能的，這幾點要先知道

誰該裝、誰可以略遏

結論

延伸閱讀：站內相關文章

分享此文：

請按讚：

關於Ｍr. Slash

商業合作

عن Mr. Slash

تواصل وتعاون تجاري

發表迴響取消回覆

相關文章

مقالات ذات صلة

加密貨幣週報（7/20–7/26）：美債殖利率上行壓抑比特幣週跌約 3%，CLARITY Act 更新草案、以太坊相對抗跌與下週 FOMC 行事曆

美股一週速覽（7/20–7/24）：Alphabet、Tesla 財報重挫拖累那指週跌 2.1%，AI 資本支出成焦點

五大交易所本週活動精選｜2026/07/27

Trending

加密貨幣週報（7/20–7/26）：美債殖利率上行壓抑比特幣週跌約 3%，CLARITY Act 更新草案、以太坊相對抗跌與下週 FOMC 行事曆

美股一週速覽（7/20–7/24）：Alphabet、Tesla 財報重挫拖累那指週跌 2.1%，AI 資本支出成焦點

五大交易所本週活動精選｜2026/07/27

Chat2DB 是什麼？不會寫 SQL 也能用一句白話查資料庫：開源免費 AI 客戶端（2026 實測）

探索更多來自 Mr. Slash｜系統流人生 的內容

探索更多來自 Mr. Slash｜系統流人生的內容