# 使用 Python 將 Microsoft Word 格式轉 HTML 或 MD
###### tags: `Python` `DOCX 轉檔` `HTML` `markdown` `mammoth`
### 一、環境準備
以 Python 轉換 Docx 檔需要使用到 mammoth 這個專案套件,因此首先要將這個安裝起來,安裝方式很簡單,只要在命令模式提示符號後輸入以下命令:
`pip install mammoth`
它會自動下載 mammoth 套件和安裝,完成後會提示
Successfully installed cobble-0.1.3 mammoth-1.4.18
(此處出現的版本編號與安裝時更新版有所不同)

這樣就可以了,很簡單...
---
### 二、轉檔
轉檔時直接到原檔案目錄輸入命令,以下 document.docx 表示來源 Docx ,需改為實際名稱,output.html (或 output.md) 則改為輸出時要給的檔名。若來源檔案不在當前目錄,則需要再來源檔案前面加上目錄路徑。
#### 1.將 Docx 轉換為 HTML
`mammoth document.docx output.html`
如果DOCX中包含影像檔,那轉出的HTML中會包含影像的base64二進位內容,只要將這HTML拖進任何一個網頁瀏覽軟體中即可正常顯示,也能將影像另外儲存。
#### 2.將 Docx 專換為 Markdown
`mammoth document.docx output.md --output-format=markdown`
如果DOCX中包含影像檔,那轉出的Markdown會包含影像的base64二進位內容,這種需要使用 Markdown 格式軟體,但影像則依然會以二進位內容顯示。