# 使用深度學習預測心臟衰竭患者的住院費用和住院時間 [**2022 年 IEEE 第四屆全球生命科學與技術會議 (LifeTech)**](https://ieeexplore.ieee.org/document/9754924) <font size="2">**DOI: 10.1109/LifeTech53646.2022.9754924**</font> <font size="1">*X. Zhou, X. Zhu and K. Nakamura*</font> ## **I. INTRODUCTION** 這篇研究的導言部分闡述了預測心力衰竭(HF)患者的住院成本和住院時間的重要性。隨著日本人口老齡化,HF已成為住院的主要原因,而且其住院時間大約是西方國家的三倍,這對社會造成了沉重負擔。因此,早期預測住院成本和住院時間對於分配醫療資源和確定治療策略非常有益。 研究者們對住院時間或成本的分析和預測做出了許多貢獻。例如,Baek等人開發了一個使用線性回歸的住院時間預測模型,但該模型忽略了患者特徵,可能限制了模型在特定疾病患者中的表現。Eigner等人則開發了預測高成本患者的模型,雖然分類表現可觀,但無法進行個體級預測。Greiner等人則專注於特定疾病成本的預測,但由於數據不平衡問題,其模型的表現較差。 線性回歸是醫療成本預測的常用方法,但其應用受限於假設和對領域知識的需求。本研究開發了一個基於深度學習的回歸模型,用於使用心力衰竭患者的電子健康記錄數據進行個體級預測。該模型能夠自動加權輸入變量,學習影響結果的潛在複雜互動。此外,該模型可以通用於住院成本和住院時間預測,避免了重複建模的需要。最後,通過與線性回歸模型的比較,確認了所提模型的優越性。 ## **II. METHODS** EHR資料收集自2016年4月至2019年3月在東邦大學大橋醫療中心收治的心臟衰竭患者。本研究已獲得東邦大學大橋醫療中心機構審查委員會的批准。 ### **A. Preprocessing** 所提出的預測系統包括兩部分:數據預處理和預測模型,如圖1所示。預處理的目的是識別預測因子,這類似於之前的一項工作[10]。每位病人的電子健康記錄(EHR)包括200多個變量,包括人口學信息、醫療歷史、實驗室測試和結果等。本研究僅使用入院時可獲得的變量進行早期預測。首先檢查每個變量中缺失的百分比,並排除缺失比例超過20%的變量。然後,連續和分類變量的缺失值分別用均值和眾數填充。同時,調整2016-2018年的成本以反映2019年日本通貨膨脹的增加。此外,高成本患者被定義為那些成本超過成本分布前10百分位的患者。成本和住院時間分布呈右偏,因此進行了對數轉換[11]。然後,使用雙尾、非配對的學生t檢驗來評估高成本和低成本組中兩個連續變量的差異,當變量呈正常分布時;對於偏斜的連續變量,使用曼惠特尼檢驗,並使用Shapiro-Wilk檢驗來測試正常性。分類變量使用皮爾森卡方檢驗或費雪精確檢驗進行比較,視情況而定。最後,p < 0.05的變量被認為是統計上顯著的,並根據變量的類型以平均值±標準偏差(SD)或頻率(百分比)的形式呈現。預處理後,獲得候選預測因子。數據預處理使用Python 3.7.7和R x64 3.6.0進行。 ![image](https://hackmd.io/_uploads/rJBjL4MVp.png) ### **B. Prediction Model** 所提出的模型主要由全連接(FC)層和卷積層組成。首先,候選預測因子被輸入到一個具有softmax激活函數的FC層中,以學習預測因子的權重。FC層中的節點數量等於預測因子的數量,因此每個預測因子可以被分配一個權重。softmax函數將權重標準化為預測因子上的概率分佈,使所有預測因子的權重總和等於一。其次,通過預測因子和上述權重之間的逐元素乘法,獲得加權預測因子。第三,經過反覆試驗後,使用了一個過濾器數量等於5,核心大小等於6,步長等於3的卷積層。在這種情況下,該層預計能從包含不同預測因子組合的多個預測因子集中學習。為了減輕過度擬合,批量正規化和以0.5概率進行的dropout被連接在卷積層之後。最後,使用一個節點的FC層來輸出預測的住院費用或住院時間的對數。該模型通過5折交叉驗證進行訓練和驗證,使用RMSprop優化器(學習率0.005)、批量大小為64,以及平均絕對誤差(MAE)損失函數。在此之後,使用後退消除法進一步提升性能和減少預測因子。 此外,以相同方式開發了一個LR模型進行性能比較。由於LR中的一個假設是預測因子之間沒有或僅有很少的多重共線性,因此通過預測因子對之間的皮爾森相關係數來評估多重共線性(所有≤0.60),如[12]中所做。 ### **C. Performance Evaluation** #### **1. MAE(平均絕對誤差)** * **優點:** 直觀:MAE衡量的是預測值和實際值之間的平均絕對差距,非常直觀。 範圍穩定:誤差的範圍固定,便於不同模型或問題間的比較。 不會放大極端值的影響:對所有的誤差給予相同的權重,不會因為極端值而產生過大的誤差。 * **缺點:** 缺乏方向性:只能得到誤差的大小,不能反映誤差的方向(過高或過低)。 對異常值不敏感:在存在異常值時,MAE提供的誤差可能會低估模型的實際誤差。 #### **2. MSE(均方誤差)** * **優點:** 放大極端值的影響:由於平方操作,對極端值非常敏感,這有助於在一些需要重視極端值的場合中識別模型性能。 可導性好:在優化算法中,MSE的可導性通常比MAE好,這有利於使用梯度下降等算法。 * **缺點:** 對異常值過於敏感:MSE會將極端值的誤差放大,導致模型過於關注異常值。 誤差的範圍不固定:MSE的值可能會非常大,使得解釋和比較變得困難。 #### **3. $R^2$(決定係數)** * **優點:** 直觀解釋模型的解釋能力: $R^2$ 值表示模型對於變量關係的解釋程度,$R^2 = 1$ 表示模型完全解釋了變量的所有變異。 標準化指標:由於範圍從0到1,便於比較不同的回歸模型。 * **缺點:** 不適用於非線性模型: $R^2$ 原本是為線性回歸模型而設計,對於非線性模型可能不夠敏感。 可能會過高評估模型的解釋能力:在包含大量預測變量的模型中, $R^2$ 可能會顯得過於樂觀。 ## **III. RESULTS AND DISCUSSION** 在這項研究中,共有562名連續心力衰竭(HF)患者入選,平均年齡78歲,其中45.7%是女性。經過數據預處理後,年齡、吸煙指數(SI)、慢性心律失常(CI)、日常生活活動能力低(LADL)、左心室射血分數(LVEF)、左心室舒張末期容積(LVEDV)、左心室舒張末期直徑(LVDd)、左心室收縮末期直徑(LVDs)、主動脈瓣置換術(AVR)、估算腎小球過濾率(eGFR)、肌酐(Cr)、NT-前B型鈉尿肽(NT-proBNP)、白蛋白(ALB)和C反應蛋白(CRP)在高成本和低成本患者之間顯示出顯著差異,並被確定為候選預測因子。 成本和住院時間有著強烈的線性關係(皮爾森相關係數=0.70),因此低成本組患者的住院時間比高成本組短得多。75歲以上的患者在低成本組中比例更高(48.3%對68.6%,P=0.004)。與低成本組患者相比,高成本組患者消耗更多煙草,日常生活活動負擔更重,腎功能和C反應蛋白水平更高。 經過反向淘汰後,最終結果包括評估指標和使用的預測因子,如表II所示。提出的模型在平均絕對誤差(MAE)、均方誤差(MSE)和R^2方面的表現均優於LR模型,無論是對住院費用還是住院時間的預測。 這項研究有幾個局限性,例如,一些變量存在不同比例的缺失值(少於20%)。這可能限制了它們的預測能力。提出的模型是在單一隊列上開發的。因此,其泛化能力需要通過外部驗證進一步確認。 ![image](https://hackmd.io/_uploads/Hk7ew4GN6.png) ![image](https://hackmd.io/_uploads/BJfmDEG4T.png) ## **IV. CONCLUSION** 該方法在住院費用和住院時間預測方面表現出相當大的性能,有望為臨床決策提供有價值的支持。