# 使用 Python 將 Microsoft Word 格式轉 HTML 或 MD ###### tags: `Python` `DOCX 轉檔` `HTML` `markdown` `mammoth` ### 一、環境準備 以 Python 轉換 Docx 檔需要使用到 mammoth 這個專案套件,因此首先要將這個安裝起來,安裝方式很簡單,只要在命令模式提示符號後輸入以下命令: `pip install mammoth` 它會自動下載 mammoth 套件和安裝,完成後會提示 Successfully installed cobble-0.1.3 mammoth-1.4.18 (此處出現的版本編號與安裝時更新版有所不同) ![](https://i.imgur.com/QTo9ZIO.png) 這樣就可以了,很簡單... --- ### 二、轉檔 轉檔時直接到原檔案目錄輸入命令,以下 document.docx 表示來源 Docx ,需改為實際名稱,output.html (或 output.md) 則改為輸出時要給的檔名。若來源檔案不在當前目錄,則需要再來源檔案前面加上目錄路徑。 #### 1.將 Docx 轉換為 HTML `mammoth document.docx output.html` 如果DOCX中包含影像檔,那轉出的HTML中會包含影像的base64二進位內容,只要將這HTML拖進任何一個網頁瀏覽軟體中即可正常顯示,也能將影像另外儲存。 #### 2.將 Docx 專換為 Markdown `mammoth document.docx output.md --output-format=markdown` 如果DOCX中包含影像檔,那轉出的Markdown會包含影像的base64二進位內容,這種需要使用 Markdown 格式軟體,但影像則依然會以二進位內容顯示。