--- disqus: ahb0222 GA : G-VF9ZT413CG --- # R套件Convert2Docx_免費高效轉換PDF成為Word檔 > [color=#40f1ef][name=LHB阿好伯, 2022/10/02][:earth_africa:](https://www.facebook.com/LHB0222/) ###### tags: `R` `Python` `R & python` [TOC] ![](https://hackmd.io/_uploads/Sy04Jo8Mo.jpg) 今天介紹的套件包本質上是Python **pdf2docx** 套件的R包裝套件 讓使用該套件變得更容易 目前像是Smallpdf等線上轉檔服務限制越來越多 若有大量轉換需求可以考慮使用免費的套件 不會有文件數量、大小限制 也不用擔心資料上傳別人的伺服器有資安問題 這次一樣使用[Rstudio(posit) cloud](https://rstudio.cloud/)線上伺服器來演示 首先使用devtools套件安裝從 github 安裝Convert2Docx套件包 ```r= install.packages('devtools') devtools::install_github("Ifeanyi55/Convert2Docx") ``` :::success 首次使用需安裝相應python套件 pip install pdf2docx ::: ![](https://hackmd.io/_uploads/r1LwZbrzi.png) 首先先上傳檔案或是將檔案放置在工作資料夾中 執行**getwd()**可以知道目前工作資料夾路徑 ![](https://hackmd.io/_uploads/rkdr8FUfj.png) 上傳PDF檔 ![](https://hackmd.io/_uploads/rJmDVtIfo.png) 載入套件執行Converter進行轉換 ``` library(Convert2Docx) pdf_name <- "CP2102-9.pdf" Converter(pdf_file = pdf_name, docx_filename = "CP2102.docx") ``` 也可以設定要轉換的頁面 ``` startANDend(pdf_file = pdf_name, docx_filename = "CP2102_1-3.docx", start = 1, end = 3) selectPages(pdf_file = pdf_name, docx_filename = "CP2102_1_3_4.docx", pages = c(1,3,4)) ``` 轉換效果 ![](https://hackmd.io/_uploads/SyOvh9IGo.png) 電腦若是有安裝過python也可以使用套件內建的GUI快速進行使用 安裝pdf2docx ![](https://hackmd.io/_uploads/r1h_Yc8fi.png) 執行==pdf2docx gui==開啟轉換軟體介面 ![](https://hackmd.io/_uploads/SJHIY58zi.png) ![](https://hackmd.io/_uploads/HJH1xJSQj.png) # 侷限性 * 需要使用含文字資料的 PDF 檔而掃描檔 * 文字從左到右排列 * 正常閱讀方向,無字變換/旋轉 * 目前尚無法百分百轉換 PDF 佈局為DOCX布局 # 相關文章 [PDF免費解鎖_pikepdf使用python&R快速解鎖](/5CL8zSP1RzabJViIjgwwMQ) [PDF免費文字辨識(OCR) ocrmypdf](/QuOHqurJQaywBhN6yS9G0g) 全文分享至 https://www.facebook.com/LHB0222/ https://www.instagram.com/ahb0222/ 有疑問想討論的都歡迎於下方留言 喜歡的幫我分享給所有的朋友 \o/ 有所錯誤歡迎指教 # [:page_with_curl: 全部文章列表](https://hackmd.io/@LHB-0222/AllWritings) ![](https://i.imgur.com/nHEcVmm.jpg)