or
or
By clicking below, you agree to our terms of service.
New to HackMD? Sign up
Syntax | Example | Reference | |
---|---|---|---|
# Header | Header | 基本排版 | |
- Unordered List |
|
||
1. Ordered List |
|
||
- [ ] Todo List |
|
||
> Blockquote | Blockquote |
||
**Bold font** | Bold font | ||
*Italics font* | Italics font | ||
~~Strikethrough~~ | |||
19^th^ | 19th | ||
H~2~O | H2O | ||
++Inserted text++ | Inserted text | ||
==Marked text== | Marked text | ||
[link text](https:// "title") | Link | ||
 | Image | ||
`Code` | Code |
在筆記中貼入程式碼 | |
```javascript var i = 0; ``` |
|
||
:smile: | ![]() |
Emoji list | |
{%youtube youtube_id %} | Externals | ||
$L^aT_eX$ | LaTeX | ||
:::info This is a alert area. ::: |
This is a alert area. |
On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?
Please give us some advice and help us improve HackMD.
Syncing
xxxxxxxxxx
Python 資料科學應用 — 血液透析之血壓預測模型 - JiunYi Yang
歡迎來到 PyCon TW 2021 共筆
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →共筆入口:https://hackmd.io/@pycontw/2021
手機版請點選上方 按鈕展開議程列表。
Welcome to PyCon TW 2021 Collaborative Writing
- The image file may be corrupted
- The server hosting the image is unavailable
- The image path is incorrect
- The image format is not supported
Learn More →Collaborative Writing Workplace:https://hackmd.io/@pycontw/2021
Using mobile please tap to unfold the agenda.
公告
嗨各位,由於我的講題預錄剛好講滿 45 分鐘,所以針對 Q&A 我會將 Slido 上的問題在這邊進行文字回覆;若相關疑問想交流,也可以到 Gather - R1 (with speaker's Q&A) 那邊找我!
Slido Q&A
Q:剛剛聽到每兩分鐘就會有一筆紀錄,想問每天更新 model 這樣的頻率有什麼考量嗎?如果更新的 model 沒有預期的好,也是會更新嗎?
Q:有說到是非本科來接觸資料分析,想知道是什麼契機XD 以及是如何開始的,有推薦的資源嗎~
我在當數位廣告操作師之前有自學過網站開發和網頁事件追蹤,所以對程式比較熟悉一些,後來因為要協助廣告客戶做成效優化,我們會整合 FB Ads, Google Ads, GA 等數據,當時有很多手工 work,才會自己去探索怎麼使用 GDS (Google Data Studio),比較快速的監控成效、從 BigQuery 撈比較細的行為維度,Python 分析廣告效果;
以及我本身對事件資料搜集端(ex:埋追蹤碼於客戶網站,進行用戶事件搜集)有興趣,因為客製廣告受眾來自於廣告商可以追到怎樣的行為、做什麼處理(條件式、建模訓練等)讓每一包變得更精準;所以選擇往數據分析端走,在前公司剛成立數據部門時有自薦加入
後來發現數據領域的開源工具迭代很快,掌握一項資料探勘技術越深、在新東西出來的時候能更快應用是更好的,因此透過發展「與想要的技能樹相匹配的」 side-project 來快速提升能力。
資料分析推薦資源:
Q:在Feature Engineering中,請問講者是如何知道/想出新的特徵?
Q:請問關於讀取資料的部份講者提到用了multi-processing來加速讀取,就我理解這部份瓶頸是在I/O,想請問為何不是考慮threading的方式處理?
Q:想請問對於長期透析的病患,只用自己的過去數據做模型來預測會不會反而效果比較好?
若是單位病患,以我們目前測試的結果而言是有相關性的;原因是以醫療類型的事件預測中,大部份都是呈現資料不平衡的問題,我們曾經使用 T-SNE、PCA、XAI 等方式來將資料視覺化並加以判斷;但考量到深度學習的需要保持資料的多樣性和數量、還有做到病人個人化模型所需的資源,目前還是傾所使用一個通用型模型來滿足臨床使用的需求。
Q:1. 請問預測是否只用當天30分鐘之前的血壓資料做預測,是否有使用過去(前幾天)洗腎資料?理論上過洗腎發生低血壓,末來發生機率會高非常多。2.請問此系統目前是否佈署在洗腎室做即時預測試用?3.請問血壓(raw data)是否是都由護理人員手動測量,平均測量間距大約是多少,預測模式是用多少的間距當input(2分鐘?)
Q:請教3個問題:(1)每隔30分鐘量一次血壓,如此量測點數很少,例如只有1個數據點,如何進行差值特徵?(2)血壓量測點數少是不是會影響False alarm次數高?(3)模型整合進入醫院的系統是否有困難?例如自動取得即時的血壓計資料。謝謝~
Q:直播畫面不清楚
演講大綱
*前情提要
講者簡介
講者:楊鈞宜
IEEE ECBIOS 2021 - Best Paper Award
I) 血液透析預測低血壓發生的重要性
真實世界問題
什麼是血液透析?
血液透析是末期腎臟病(ESRD)的保守性療法,目前全球約有 2,000,000 位透析病患,以台灣為例,約有 95,000 位透析病患,近 18 年透析盛行率增加 8.9%、發生率增加 3.7%;每年新增 12,346 人、淨增加約 2,300 人
但透析患者五年累積存活率卻只有 56.2%,這方面的治療更是全民健保支出的第 1 名。
其原理是透過人工腎臟將血液抽出體外,過濾掉當中的廢物與多餘水分,再將過濾後的血液輸回患者體內。每位病患每週要接受 3 次療程,每次 4 小時。
透析中低血壓發生的影響
儘管在這十多年透析機器與技術進步,透析低血壓之發生率仍然居高不下;大約 20%–50% 透析療程會出現透析低血壓。
透析低血壓的發生直接或間接的導致或加重許多併發症與共病,如冠狀動脈心臟病與腦血管疾病等,也直接導致病患出現如痙攣、意識障礙、虛弱與腸胃症狀等降低病人生活品質。
然而對於低血壓的處理,包含降低脫水量、降低流速等,更會讓透析品質下降。
綜合以上,護理人員更會因低血壓而產生的加班照護成本 10~15 mins 的護理成本 (US$ 5 - $7.5),嚴重時更可能產生訴訟成本,總額外醫療成本估計超過 10 億台幣。
提出解決方案:血液透析低血壓預警系統
由於護理人員最快只能間隔 30 分鐘量一次血壓,我們希望透過預警系統提前對下次量測(30分鐘後)發生低血壓機率高於門檻的病患發出預警,讓醫護能夠對病房狀況排序處理。
II) 建模目標、流程說明
雙指標輔助醫護判斷
Data Pipeline Overview
III) 血液透析數據介紹
資料表介紹
資料探索
IV) 數據前處理與特徵生成
前處理流程
格式轉換:以滑動視窗產生訓練資料
使用 Multiprocessing 節省處理時間
使用前幾次血壓記錄生成「差值特徵」
使用 SMOTE 算法對少數標籤合成新樣本,平衡兩類別的樣本數
V) 建模、優化與成效視覺化
以交叉驗證結果進行參數搜尋最佳化
遞迴特徵排除 Recursive Feature Elimination
分類
二元分類混肴矩陣(指標解釋)
機器學習分類器中,以 LightGBM Classifier 較佳
不同參數設置下的 RNN 模型中,LSTM 擁有較佳成效
使用 SHAP 值增加模型可解釋性
Ensemble Learning with Blending
迴歸
CatBoost Regressor 較佳;遞迴特徵排除使 R2 再提升 0.7%
GRU 效果較佳;遞迴特徵排除使 R2 再提升 1.7%
同樣使用 SHAP 值視覺化每個樣本特徵的重要度
81.3% 的預測誤差在 10 mmHg 以內
結語
後續我們已將資料及建模流程自動化:
未來將持續優化模型成效,並建置模型版控流程等
若您對於本講題的模型再優化有興趣,歡迎相互交流
聯繫方式
Jiun-Yi Yang
Nero Un
tags:
PyConTW2021