---
disqus: ahb0222
GA : G-VF9ZT413CG
---
# R套件Convert2Docx_免費高效轉換PDF成為Word檔
> [color=#40f1ef][name=LHB阿好伯, 2022/10/02][:earth_africa:](https://www.facebook.com/LHB0222/)
###### tags: `R` `Python` `R & python`
[TOC]

今天介紹的套件包本質上是Python **pdf2docx** 套件的R包裝套件
讓使用該套件變得更容易
目前像是Smallpdf等線上轉檔服務限制越來越多
若有大量轉換需求可以考慮使用免費的套件
不會有文件數量、大小限制
也不用擔心資料上傳別人的伺服器有資安問題
這次一樣使用[Rstudio(posit) cloud](https://rstudio.cloud/)線上伺服器來演示
首先使用devtools套件安裝從 github 安裝Convert2Docx套件包
```r=
install.packages('devtools')
devtools::install_github("Ifeanyi55/Convert2Docx")
```
:::success
首次使用需安裝相應python套件
pip install pdf2docx
:::

首先先上傳檔案或是將檔案放置在工作資料夾中
執行**getwd()**可以知道目前工作資料夾路徑

上傳PDF檔

載入套件執行Converter進行轉換
```
library(Convert2Docx)
pdf_name <- "CP2102-9.pdf"
Converter(pdf_file = pdf_name,
docx_filename = "CP2102.docx")
```
也可以設定要轉換的頁面
```
startANDend(pdf_file = pdf_name,
docx_filename = "CP2102_1-3.docx",
start = 1, end = 3)
selectPages(pdf_file = pdf_name,
docx_filename = "CP2102_1_3_4.docx",
pages = c(1,3,4))
```
轉換效果

電腦若是有安裝過python也可以使用套件內建的GUI快速進行使用
安裝pdf2docx

執行==pdf2docx gui==開啟轉換軟體介面


# 侷限性
* 需要使用含文字資料的 PDF 檔而掃描檔
* 文字從左到右排列
* 正常閱讀方向,無字變換/旋轉
* 目前尚無法百分百轉換 PDF 佈局為DOCX布局
# 相關文章
[PDF免費解鎖_pikepdf使用python&R快速解鎖](/5CL8zSP1RzabJViIjgwwMQ)
[PDF免費文字辨識(OCR) ocrmypdf](/QuOHqurJQaywBhN6yS9G0g)
全文分享至
https://www.facebook.com/LHB0222/
https://www.instagram.com/ahb0222/
有疑問想討論的都歡迎於下方留言
喜歡的幫我分享給所有的朋友 \o/
有所錯誤歡迎指教
# [:page_with_curl: 全部文章列表](https://hackmd.io/@LHB-0222/AllWritings)
