# 【論文閱讀】Examining the challenges of blood pressure estimation via photoplethysmogram [Arxiv Paper Link](https://arxiv.org/pdf/2304.14916) ## Info * Author : Suril Mehta, Nipun Kwatra, Mohit Jain, Daniel McDuff * Institution : Microsoft Research ## Abstruct 論文探討了非穿戴裝置使用 PPG 訊號來進行非侵入式血壓預測的挑戰,然而論文指出, PPG 訊號在血壓預測中的可靠性存在爭議,原因包含 **數據洩漏 (Data Leakage)**,資料集限制、信號處理方式不一致等問題,論文表示這樣問題導致某些研究報告的性能被過於高估,限制了 PPG 訊號在臨床發展的可性度,作者提出分析工具來檢驗 PPG 訊號是否適合於血壓預測,並且與心率訊號預測進行比對 ### 核心貢獻 1. 探討 PPG 訊號在血壓估計任務上存在數據洩漏的問題,並分析與研究其結果影響 2. 提出 「多值映射因子」 (Multi-valued mapping factor) 與 「相互資訊」 (Mutual Information,MI ) 的工具來量化 PPG 信號與血壓之間的資訊關聯 3. 透過對比血壓/心率等預測任務,顯示 PPG 訊號的在血壓估計的**侷限性** ![image](https://hackmd.io/_uploads/ByxkGLKKle.png) ## Data Leakage * Data-Overlap : 在進行訊號的 segmetation ,同一病人同一組 Sample 的 Segment 被分別放入訓練與測試 * Domain-Overlap : 對於同一個患者的不同 sample 會被分割進訓練與測試資料 下圖很好說明了這兩種 Data leakage 的差別 ![image](https://hackmd.io/_uploads/H1G4dLYKge.png) 下圖揭示了 Data leakage 造成標準差能夠快速了下降,代表著個體差異極大,只要有看過類似的 sample 或者 segmetation 就可以改善模型預測 ![image](https://hackmd.io/_uploads/rJ5P_8FYgl.png) ### Overconstraining the task 與健康相關資料多半呈現非高斯分布的球況,也就是大多數的資料都集中在正常或者健康的範圍資內,但會隨著資料範圍擴大而已指數等級下降,然而論文發現,對於部分檢測數值極大或極小的資料,被大部分論文是作為 Outlier 進而捨棄,這樣方式將會導致兩個問題,第一個將導致在評估資料級時不足夠全面,第二將導致超出統計值範圍資料將大幅減少,導致預測任務便更簡單 * Schlesinger et al. (Reference 27) : * Operation: Discarded SBP samples outside the range of 75–165 mmHg. * Rationale: Considered values outside this range as “improbable.” * Impact: Excluded higher SBP values, including those in the range of Grade-2 (160–179 mmHg) and Grade-3 (≥180 mmHg) hypertension, potentially omitting clinically significant data. * Cao et al. (Reference 22) : * Operation : Constrained SBP samples to the range of 75–150 mmHg. * Rationale : Likely to remove outliers attributed to noise in the data collection process. * Impact : Excluded values corresponding to Grade-1 (140–159 mmHg), Grade-2 (160–179 mmHg), and Grade-3 (≥180 mmHg) hypertension, significantly limiting the dataset to mostly normal or mildly hypertensive values. * Hill et al. (Reference 29) : * Operation: Constrained SBP samples to the range of 75–150 mmHg. * Rationale: Similar to Cao et al., likely to eliminate noisy or improbable data. * Impact: Similarly excluded values in the ranges of Grade-1, Grade-2, and Grade-3 hypertension, restricting analysis to a narrower, less severe BP range. ![image](https://hackmd.io/_uploads/rJt8jLFFll.png) ### Unreasonable Calibration 在健康評估或檢測時,往往是與人高度相關的被稱作 Person-dependent,而這先因素包含 blood viscosity ( visc )、 stiffness of blood vessels ( stif ) 等等,然而 PPG 訊號能夠捕捉到的資訊最常見的就是心率,而 visc、stif 並不能,而為了解決這個問就提出需要校正,需要收集病患的 PPG 訊號並與其標準血壓來進行向校正 1. Cao et al.'s' method 每次BP預測前需重新校正,以確保穿戴設備(如手錶)的最佳貼合 2. Schlesinger method 僅需一次校正,計算模型預測與真實值的偏移量 ( offset ) 進而衍生出一系列的問題 1. 我們該在甚麼時候進行校正 ? 2. 校正的頻率 ? 3. 校正方法是否受到環境影響 ? * Naive : 在評估時採用 3 個 window預測平均作為常數預測值,不切實際 * Offset : 需要將模型預測做一次 offset ![image](https://hackmd.io/_uploads/ByNkCIKKll.png) ### Unrealistic Preprocessing or Filtering 前處理方法,各家論文也是不太一樣,通常以 Band-Pass Filter 與使用 Auto-Corrlation 來進行閥值過濾,但通常這樣結果都導致訓練資料大量減少,Schlesinger 論文當中只使用 $5\%$ 的訓練資料,這樣資料處理方法導致容易訓練上 Overfitting 且在實務上難以運作,因為我們在實際應用上不會有如此乾淨的資料 ![image](https://hackmd.io/_uploads/HkhiB_tFex.png) ![image](https://hackmd.io/_uploads/BJ76rOYYxe.png) ## Method 本論文使用兩個工具來驗證輸入訊號是否能夠作為 good predictor of the output,我們使用 principled analysis 來研究 PPG 訊號與 BP 之間關心,為了比較論文也有使用 Heart rate (HR) 與 Reflected Wave arrival time (RWAT) 這兩種都被視為是可以透過 PPG 訊號的 good predictor 1. Multi-valued Mappings 2. Mutual Information ### Checking for Multi-Valued Mappings 檢查是否有多個相似 PPG 對應到 不同波型的 ABP,也就是 ill-Condition,代表輸入小的變動,會導致輸出有大的變動 * PPG 訊號透過 Cross-correlation 與 Euclidean distance 來計算相似性 * 資料切分成非重疊的 2s 的窗口,代表有 250 sample points 然後訊號的距離閥值為 1.0 * 輸出閥值為 8 mmHg for BP, 8 bps for HR, 0.02s for RWAT ![image](https://hackmd.io/_uploads/Sy8PauKYgx.png) Algorithm 1 演算法 ![image](https://hackmd.io/_uploads/SkFFrYKYxl.png) Tabel 5 顯示了 Multi-valued mapping 對於 BP、HR、RWAT 預測 ![image](https://hackmd.io/_uploads/r1PvjFTYeg.png) ### Evaluating Mutual Information 論文使用 **KNN** 方法來估計 PPG 訊號與輸出的 (血壓 BP, 心率 HR, RWAT) 之間的MI,為了要降低 PPG 訊號的維度,我們需要手動去取一些特徵出來,論文中分別使用 **Handcraft** 與 **AutoEncoder** 學習特徵表達,並使用 **Info-Fraction** 指標來評估,由於相互信息值受限於目標變數的 Entropy,後者為最大的可表達的相互資訊,相互資訊代表著兩個變數相互依賴的程度,數值越大表示兩個資訊相關係數越大 相關資訊的計算方式,應該與 KNN 不太一樣,這部分還有疑慮 $$ I(X;Y) = \sum _{y\in Y}\sum _{x\in X}p(x,y)\log {\left({\frac {p(x,y)}{p(x)\,p(y)}}\right)} $$ * $X, Y$ : 高度相關的話,數值會比較高 * $I(X;Y) = 0$ : 表示 $X$, $Y$ 彼此獨立 $$ \text{Info-Fraction} = \frac{I(X;Y)}{H(Y)} $$ * $H(x) = -\sum_{x}(x) \log {(x)}$ : Entropy 以下為所使用的 Handcraft 特徵 ![image](https://hackmd.io/_uploads/SyVq4yotlx.png) 就 MIMIC 資料集結果,單一心率的 Info-fraction 大約在 $4.1\%$,結合所有特徵後到達 $9.5 \%$ 表示 PPG 訊號對於血壓預測結果資訊量有限,且高度依賴心率 Tabel 7 解讀 * 手工特徵的 Info-Fraction 為 9.5%,表示僅捕捉 SBP 變異的 9.5% * PPG 訊號的形態特徵(如斜率、振幅)對血壓預測的資訊貢獻有限,超過 90% 的 SBP 變異無法從 PPG 特徵解釋,顯示 PPG 單獨用於血壓估測的理論限制 ![image](https://hackmd.io/_uploads/H1a2-iTYel.png) Table 8 解讀 * 手工特徵的 Info-Fraction :9.8% * 心率特徵的 Info-Fractiob : 高達 88.8% ![image](https://hackmd.io/_uploads/SyXmU1jKeg.png) Table 9 解讀 * MIMIC 資料集:自編碼器特徵的 Info-Fraction 為 $12.9\%$ ( SBP )。 * Aurora-BP 資料集:自編碼器特徵的 Info-Fraction 約 $13.2\%$ ( SBP )。 * 解讀雖然自編碼器通過無監督學習捕捉更複雜的 PPG 模式,Info-Fraction 略高於手工特徵,但增幅有限(9.5% → 12.9%),顯示 PPG 訊號的資訊瓶頸是本質問題,而非特徵萃取方法的限制。 ![image](https://hackmd.io/_uploads/HJigIkjFlg.png) ## Conclusion PPG 訊號回歸血壓這個任務目前還是一個未解決的問題,原因在於 PPG 訊號上並無顯著特徵可以用於回歸血壓,爾且先前研究都導致人們認為 PPG 訊號可以回歸出血壓進而有 Over-Optimistic 預期,所以我們需要從資訊量去驗證任務是否可行,目前 Paper 只有 Release 部分程式碼,顯然 MI 部分要自己實現 ## Problem Set 1. 在 MI 實驗表格中,Inter-Patient 跟 Infra-Patient 之間關係會合 Inter-patient 會比較低 ? 基數變多,但本來 matching 應該會在上升才對 * Intra-patient 是同一患者內比對,Inter-patient 是不同患者間的比對 * 因為個體差異大,即不同患者的生理差異很大 ( 例如血管硬度、血黏度、基礎血壓 ) 等等差異,即使有機會不同患者間找到 matching 的訊號,但由於分母成呈現二次方上升而導至整體配對比率下降 $$ \text{Ratio} = \frac{\text{Match}}{\text{Total_Match}} $$ 2. 在 Multi-Valued Mapping 中 threshold 如何定義出來的 * PPG 訊號有距離閥值說明,但 ABP 的閥值沒有說明 * 由於論文驗證資料長度為 2s 共 250 個樣本點數,論問將每個點的差異設定為 $4 \cdot 10^{-3}$ 所以閥值為 $250 \cdot 4 \cdot 10^{-3} = 1$