<style>
.markdown-body table{
display: unset;
}
</style>
# 使用 Python 讀取、寫入 ods 的套件 pyexcel-ods3
> 作者:王一哲
> 日期:2023年8月11日
## 前言
這幾天有一位大學的學長問到如何用 Python 寫 LibreOffice Calc 的巨集,但是目前網路上能找到的資料很少。後來學長想到另一個作法,不要寫巨集,只要用 Pythoon 程式從 ods 檔中讀取資料,在程式中處理完資料,再將資料寫入 ods 檔中,應該也能做到類似的效果。我在網路上找到一些套件,其中一個就是 pyexcel-ods3,經過測試後可以成功地讀取、寫入 ods 檔,以下是簡單的筆記。
<br />
## 安裝套件
如果只要處理 ods 檔,可以在命令列界面中輸入以下指令安裝套件
```shell
pip3 install pyexcel-ods3
```
如果還要處理其它格式的檔案,例如 xlsx,可以在命令列界面中輸入以下指令安裝套件
```shell
pip3 install pyexcel
```
由於處理資料時使用 NumPy ndarray 會比較方便,建議安裝 NumPy。
```shell
pip3 install numpy
```
雖然在以下的程式中會使用到 json 及 collections,但這兩個套件是預設的,不需要另外安裝。
<br />
## 基本語法
以下的程式碼中,假設已經引入函式庫
```python
import pyexcel_ods3 as pe
import json
import numpy as np
from collections import OrderedDict
```
<br />
### 由 ods 檔讀取資料
語法為
```python
輸入資料 = pe.get_data("檔名", start_row=索引值, row_limit=列數)
json.dumps(輸入資料)
```
1. 如果 ods 檔與程式碼放在同一個資料夾中,可以只輸入檔名。
2. start_row:從 0 開始算,如果 start_row=2 會從 ods 檔第3列開始讀取資料。
3. row_limit:讀取資料列數。
4. get_data 讀到的資料格式是 json,要用 json.dumps 將資料轉成 OrderedDict,key 值為分頁名稱,對應的 value 為二維 list。
5. pyexcel 的概念是將一個分頁當作很大的二維陣列,所以讀取、寫入的分頁資料都會是二維 list,例如
```python
[[1], [2], [3]] # 只有1欄、內容為1、2、3
[[1, 2, 3]] # 只有1列、內容為1、2、3
```
<br />
### 更新要寫入 ods 檔的資料
語法為
```python
輸出資料 = OrderedDict()
輸出資料.update({"分頁名稱": 二維 list 資料})
```
資料格式是二維 list,如果使用 NumPy ndarray 會回傳錯誤訊息。將輸出資料寫入 ods 檔時會覆蓋掉原來的檔案內容,無法指定只寫入某個分頁,因此要記得將原來在檔案中的資料也用 update 加到輸出資料中。
<br />
### 將輸出資料寫入 ods 檔
語法為
```python
save_data("檔名", 輸出資料)
```
如果執行程式時要寫入的 ods 檔已開啟,要先關閉再開啟 ods 檔才能看到寫入資料後的內容。
<br />
## 範例程式碼
### 由指定分頁讀取一欄資料,將處理後的資料寫到另一個分頁
假設檔案 test.ods 只有一個名為 Input 的分頁,只有 A 欄中有資料,資料為整數 1 到 10。以下的程式碼會從 Input 分頁讀取 A 欄資料,將資料存入 NumPy ndarray x,再將 x 乘以 2 之後存入 y,最後將 y 寫入 Output 分頁的 A 欄。
```python=
from pyexcel_ods3 import save_data, get_data
import json
import numpy as np
from collections import OrderedDict
# 由 ods 檔讀取並處理資料
dataIn = get_data("test.ods")
print(json.dumps(dataIn))
x = np.asarray([d[0] for d in dataIn["Input"]])
y = 2*x
x = x.reshape(len(x), 1).tolist()
y = y.reshape(len(y), 1).tolist()
# 將資料寫入 ods 檔
dataOut = OrderedDict()
dataOut.update({"Input": x})
dataOut.update({"Output": y})
save_data("test.ods", dataOut)
```
<br />
1. 第8行:由於 dataIn["Input"] 的值為二維 list,先用 for 迴圈取出 d[0] 的資料,再用 np.asarray 轉成 NumPy ndarray 指定給變數 x。
2. 第10、11行:如果 x、y 原來的長度為 N,先用 reshape 將 x、y 轉成 $N \times 1$ 的二維 ndarray,再用 tolist() 轉換成 list,最後分別指定給 x、y。
3. 第16行:用 save_data() 將資料 dataOut 寫入 test.ods。
<br />
### 由指定分頁讀取2欄資料,將處理後的資料寫到另一個分頁
假設檔案 test2.ods 只有一個名為 Input 的分頁,A、B 欄中有皆資料。以下的程式碼會從 Input 分頁讀取 A、B 欄資料,將 A 欄資料存入 x,再將 x 乘以 2 之後存入 z;將 B 欄資料存入 y,再將 y 乘以 3 之後存入 a;最後將 z、a 寫入 Output 分頁的 A、B 欄。
<div style="text-align:center">輸入、輸出資料</div>
<div style="text-align:center">
<table>
| <center>Input A 欄</center> | Input B 欄 | Output A 欄 | Output B 欄 |
| --------- | --------- | --------- | --------- |
| 1 | 0.1 | 2 | 0.3 |
| 2 | 0.2 | 4 | 0.6 |
| 3 | 0.3 | 6 | 0.9 |
| 4 | 0.4 | 8 | 1.2 |
| 5 | 0.5 | 10 | 1.5 |
| 6 | 0.6 | 12 | 1.8 |
| 7 | 0.7 | 14 | 2.1 |
| 8 | 0.8 | 16 | 2.4 |
| 9 | 0.9 | 18 | 2.7 |
|10 | 1.0 | 20 | 3.0 |
</table>
</div>
<br />
```python=
import pyexcel_ods3 as pe
import json
import numpy as np
from collections import OrderedDict
# 由 ods 檔讀取並處理資料
dataIn = pe.get_data("test2.ods")
json.dumps(dataIn)
x = np.asarray([d[0] for d in dataIn["Input"]])
y = np.asarray([d[1] for d in dataIn["Input"]])
z = 2*x
a = 3*y
# 將資料寫入 ods 檔
dataOut = OrderedDict()
dataOut.update({"Input": list(zip(x.tolist(), y.tolist()))})
dataOut.update({"Output": list(zip(z.tolist(), a.tolist()))})
pe.save_data("test2.ods", dataOut)
```
<br />
大部分的程式碼與前一個範例相似,以下只說明第14、15行。由於 x、y、z、a 都是一維 ndarray,需要先轉成二維 list 才能加到 dataOut 當中,可以分為以下3個步驟:
1. 用 tolist() 從 ndarray 轉換成 list。
2. 用 zip() 將轉換後的兩個 list 依序取出元素,組成兩個一組的數組 (tuple)。
3. 用 list() 將一連串的數組轉換成二維 list,例如 x、y 轉換後的資料為
```python
[(1, 0.1), (2, 0.2), (3, 0.3), (4, 0.4), (5, 0.5), (6, 0.6), (7, 0.7), (8, 0.8), (9, 0.9), (10, 1.0)]
```
<br />
## 結語
由於使用 LibreOffice Calc 的人比較少,想要用 Python 讀取、寫入 ods 檔的人更少,網路上相關的文章特別難找,希望這篇筆記能幫助到有需要的人。
<br />
## 參考資料
1. [pyexcel GitHub 頁面](https://github.com/pyexcel/pyexcel)
2. [pyexcel 手冊](https://buildmedia.readthedocs.org/media/pdf/pyexcel/latest/pyexcel.pdf)
3. [pyexcel-ods3 PyPI 頁面](https://pypi.org/project/pyexcel-ods3/)
---
###### tags:`LibreOffice Calc`、`Python`