過去,醫(yī)療行業(yè)的研究人員需要手動收集和分析大量數(shù)據(jù)來預測和治療疾病。面對復雜的數(shù)據(jù)信息,相關的數(shù)據(jù)分析工作極具挑戰(zhàn)性。隨著人工智能的發(fā)展,醫(yī)生在就診時根據(jù)實驗室檢測結(jié)果、家族史、臨床試驗數(shù)據(jù)和其他生命統(tǒng)計數(shù)據(jù)獲得實時分析報告將成為現(xiàn)實。本文以人工智能在重癥醫(yī)學中的應用為例,描述了如何利用DarwinML來輔助醫(yī)療行業(yè)的數(shù)據(jù)科學家進行自動建模。數(shù)據(jù)融合數(shù)據(jù)提取平臺該平臺幫助醫(yī)學數(shù)據(jù)科學家將原始數(shù)據(jù)自動轉(zhuǎn)換為模型可以使用的特征數(shù)據(jù)。該功能以數(shù)據(jù)流的形式實現(xiàn),研究人員可以通過修改參數(shù)和拖動節(jié)點靈活改變特征提取過程。下圖是一個數(shù)據(jù)流圖。DarwinMLStudio自動建模平臺從數(shù)據(jù)導入和清理開始。DarwinML可以自動建模并給出模型的多向評價結(jié)果。數(shù)據(jù)科學家只需要關注模型的評估結(jié)果。根據(jù)研究目標,研究者將返回調(diào)整初始數(shù)據(jù)清理方案和模型設置,多次建立模型,并選擇滿足研究需要的最終模型。DarwinML自動建模平臺的整個過程如下:1)數(shù)據(jù)清理:平衡樣本分布,填充缺失值,消除特征的異常值,數(shù)字化文本特征。2)模型設計:根據(jù)研究人員的數(shù)據(jù)特征和參數(shù)設置,在搜索空間中自動構建最優(yōu)網(wǎng)絡結(jié)構。網(wǎng)絡結(jié)構將在平臺中顯示如下。3)超級參數(shù)調(diào)整:為最佳網(wǎng)絡結(jié)構和數(shù)據(jù)特征提供匹配的最佳超級參數(shù)組合,如下圖所示“超級參數(shù)”欄中的XGBClassifiler的學習速率和嵌套參數(shù)。4)模型訓練:使用最優(yōu)網(wǎng)絡和超級參數(shù)的組合來實際訓練模型。5)模型評價:給出了召回率、精度和AUC等基本指標值,從模型角度給出了重要欄目的分析結(jié)果,從樣本角度給出了單個樣本的重要特征分析。同時,DarwinML自動建模平臺也支持只使用一些需要的功能。例如,我們可以導入一組新患者的檢查數(shù)據(jù),使用上次訓練的模型,并且只評估模型,從而預測這組新患者的患病概率。病例:中嚴重感染綜合征(也稱為敗血癥)的預后研究根據(jù)其早期檢查指標,我們使用DarwinML對重癥監(jiān)護病房(ICU)中的患者進行嚴重感染綜合征(也稱為敗血癥)的警告
電商動態(tài)
面向醫(yī)療行業(yè)數(shù)據(jù)科學家的人工智能解決方案:自動建模平臺
瀏覽:162 時間:2023-9-12