# RDBMS 資料庫案例設計
> - PHP 也有 Day 番外篇 [name=Ant]
> [RDBMS 資料庫案例設計 - 錢麟的墨冊](https://kylinyu.win/rdbms_design/)
## Schema 欄位設計怎麼開?
- 時間欄位
- timestamp
- datetime (only support until [2038](https://zh.wikipedia.org/wiki/2038%E5%B9%B4%E9%97%AE%E9%A2%98))
- interger (Facebook, PIXNET 選用 Interger)
- 通常有國際標準的就直接 Follow, e.g. `ISO`, `RFC`, `Schema.org`
- [電話號碼標準](https://en.wikipedia.org/wiki/E.164#Telephone_number_categories)
- 國際區碼 (Country Code)
- 各國幣值
:::warning
其實沒有絕對的標準,通常搭配業務需求來決定,也非僅有一組最佳答案
:::
- 舉例來說,密碼欄位長度設計:根據我的加密演算法產生的長度來制定
- password: char(60)
- by `password_hash("password", PASSWORD_BCRYPT)` 固定產生長度為 60 的字串
----
## 怎麼打資料庫 Index
:::success
原則上看 where 後面用到什麼,搭配 explain 指令來查看 sql 語法吃到的 index 是哪個
:::
### 情境一:用戶登入頁
```sql
SELECT * FROM users WHERE ( `email`={email} OR `username`={username} ) AND `password`={password} AND `password_expired_at` > NOW() AND `status` = {active};
```
where 後面主要有 `email` OR `username` AND `password` AND `password_expired_at`
接著
#### 1. 對 wherer 後面分別建立 index
- **index**: `[email]`, `[username]`
- **explain**: index merge `idx_email, idx_username`
#### 2. 多打 password index
- **index**: `[email]`, `[username]`, `[password]`
- **explain**: `idx_email`
- 發現原先打的 username 跟 password 都用不到了,只用 email 就可以
---- 清除所有 index ----
#### 3. 複合鍵的 Index 順序差別為何
##### 3.1 username + email
- **index**: `[username, email]`
- **explain**: 沒吃到複合鍵的 index
- 所以 OR 的條件應該要分別建立 index
##### 3.2 email + username
- **index**: `[email, username]`
- **explain**: index sort_union`(idx_email_username, idx_username_email)`
### 情境二:用戶認證頁
```sql
SELECT id, email, status FROM users WHERE `email` = {email} AND `token` = {token} AND `token_expired_at` > NOW() AND `status` = {unverified}
```
- **index**: `[email]`
- **explain**: 直接吃掉 email index.
### 覆蓋索引 Covering Index. (最快速的 index)
:::info
通常我們可以把資料儲存分成 Index 跟 data,這兩塊是分地儲存的
:::
撈資料的流程,通常是從 index 查找看是否滿足。如果所要欄位在 index 裡面沒有,就要額外到 data 區查找來回傳。
但是如果要撈出來的資料在 index 裡面就涵蓋了,就不需要去 data 區撈資料了。這種取得方式稱為`Covering Index` 也可以說是最快速的 Index.
## 資料底層儲存
- innodb_space
- 檢查 datatype 設計是否得宜,可以利用 innodb_space 工具指令,來把數據結構 dump 出來
- 查看儲存的 record 位置以及順序等等
- page_illustrate
- 畫出實際資料在 page 中的儲存大小與位置
### 案例分析 char vs varchar
利用 innodb_space, page_illustrate 來分析 char, varchar 之間的更新變換
#### char 變動資料案例
由於 char 的資料結構原本就是固定長度
- 不管同一筆資料在修改後長度是否 「超出」 或者 「小於」 原先長度
- `record` 儲存位置不變
- 長度 「超過」原先大小會被截斷
- 長度 「小於」原先大小會留下空間
- `page` 中的位置會產生碎片,因為原先就預留 char 的大小位置
#### varchar 變動資料案例
在發生更新資料長度不同的時候
- 與初始資料 「一樣長」,
- `record` 儲存位置不變
- `page` 儲存結構圖沒變,因為空間還是夠塞
- 比初始資料 「短」,
- `record` 儲存位置不變
- `page` 儲存結構圖沒變,因為空間還是夠塞
- 比初始資料 「長」,
- `record` 儲存位置改變,因為原先位置放不下
- `page` 儲存結構圖舊的位置產生碎片,新的資料存放到大小允許的空間
#### 資料碎片
- 通常碎片發生在 `update` 跟 `delete` 的時候
- 下一筆 insert 長度 「相同」 前一個碎片空間,也不會放在碎片空間
- 下一筆 insert 長度 「小於」 前一個碎片空間,就會放進去了
- 副作用
- 搜尋變慢
- 佔硬碟空間
- 解決碎片浪費空間的方法
- mysql optimze table
- 需要時間,還會 `Lock Table` !!!!
::: success
若欄位業務很常要 update 但不想要產生碎片,就用 char 吧!!
:::
### 延伸問題
> Question: 為何不 nullable?
- 當你要 update 從 null 改成有值時,會留下一個很大的碎片。
- 讀的時候無法預測,速度會變慢
- 對於 SQL 也不用下 is not NULL
- 對於底層影響很大
- 程式不用處理 null 的情境*(自行補充)*
@ 當然如果有業務需求也可以使用
以上為聽 Ant 口語跟 Demo 操作時的個人筆記,建議大家都可以試著自己操作分析加深印象