李子奇 教授 | 健康促進與衛生教育學系
李子奇教授使用大型衛生資料庫進行研究,已發表列名第一或通訊作者SCI/SSCI大數據統計分析論文達50篇以上,其中有部份論文刊登於JAMA network, British Journal of Psychiatry等知名學術期刊。李教授的研究興趣在於開發大數據統計分析程式,結合自行研發的高效率分析程式、流行病學與基因體學的研究方法,並以實際資料庫進行分析程式的驗証,實証醫學資料庫在嚴謹的方法學架構下的臨床醫學研究潛力。
【本篇報導由健康促進與衛生教育學系 李子奇教授研究團隊提供】
過去研究已經發現許多與晚發型阿茲海默症(LOAD)相關的先前共病症,但文獻中很少同時分析所有先前疾病。本研究的目標是發掘與LOAD相關的先前疾病並為其構建關聯網絡。我們使用臺灣全民健康保險研究資料庫和重大傷病資料庫,納入1997-2013年的數據進行一項全人口的配對病例對照研究。先前疾病定義以國際疾病分類第九次修訂代碼(ICD-9-CM)前三碼為依據,納入標準要求每個先前疾病ICD代碼至少存在1年且至少有2次門診就診或有1次住院診斷。病例組包括2007-2013年新診斷為LOAD的4,600名患者。LOAD患者按性別和年齡進行匹配,以獲得4,600名對照組個案。使用逐步多元邏輯迴歸分析,篩選了在首次診斷LOAD的1年以前、2年以前、. . .、9年以前先前疾病。路徑分析用於構建先前疾病和LOAD之間的關聯網絡。研究結果顯示,以下先前疾病與LOAD的發生率呈正相關:焦慮(ICD代碼 300)、功能性消化障礙(ICD代碼 564)、精神病理學特異性症狀(ICD代碼 307)、前庭系統疾病(ICD代碼 386)、腦震盪(ICD代碼 850)、尿道和泌尿道疾病(ICD代碼 599)、屈光和調節障礙(ICD代碼 367)和聽力損失(ICD代碼 389);本研究發現的許多與LOAD 發生率呈正相關的先前疾病和文獻一致。本研究支持論點:精神疾病、聽力、前庭系統和功能性消化系統疾病可能在LOAD的發病機制中起重要作用。
人為什麼會得某一種重大疾病?這問題困擾了人類數千年,許多醫學科學家畢其一生都在尋找答案,他們的努力使得醫學知識漸漸地累積;但許多重大且致死性很高的疾病,其成因至今仍不清楚,甚至沒有治療方法。本研究團隊利用大數據資料庫與自行研發的統計分析程式,嘗試以機器學習的方式提供疾病成因的資訊,期望給醫學科學家們新的研究方向參考,加速對特定疾病成因的瞭解及新療法的發展。
本篇研究是一系列「AI醫學科學家」驗證論文之一:探索失智症之相關共病症(1),類似的分析程式也成功在肌萎縮性脊髓側索硬化症(2)、胰臟癌(3)、全身性紅斑狼瘡(4)得到印証,大腸癌的驗証結果正在投稿審查中。
過去研究關於先前共病症的分析大多以單一時點的診斷資料進行相關分析,且只納入少數共病症進行分析。研究團隊一系列研究使用的「AI醫學科學家」分析程式,控制了性別、年齡、投保地城鄉、投保薪資等社會人口學變項進行配對病例對照研究以校正干擾變項的影響;以國際疾病分類碼第九次修訂代碼(ICD-9-CM)的前3碼為依據盡可能地納入更多疾病進行分析,每一種疾病透過具有2次且存在1年以上全民健保門診紀錄或有1次以上住院紀錄做為疾病納入的驗證條件,而目標疾病的研究對象(如本篇研究的「失智症」)更以領有重大傷病卡為納入依據。
本研究的「AI醫學科學家」分析程式具有流行病學與基因體學的研究方法中幾項優勢:(a)多個時點的時序性訊息納入分析模型(b)納入分析疾病具有明確的操作型定義(c)流行病學研究設計校正干擾變項(d)基因體學研究方法的全面分析概念。此外,關於大數據配對分析所需的電腦程式,本研究捨棄傳統迴圈式程式低效率的缺點,研究團隊自行開發了分層隨機抽樣式的配對程式,該程式的大數據配對分析效率較不受納入研究樣本數及配對變數量的影響,可以在數小時內以個人電腦達成百萬人等級的配對研究資料篩選,即可快速從3000萬人口的資料庫中配對完成100萬個病例組及100萬個對照組個案。
失智症是一種嚴重使人衰弱失能的疾病,隨之帶來沉重的社會和經濟負擔,而快速老化的人口結構增加了全世界失智症的罹病率。目前失智症的治療只能幫助緩解症狀,無法治癒。其中,晚發型阿茲海默失智症(Late-onset Alzheimer’s disease dementia, LOAD)佔所有失智症病例的60-80%;然而,LOAD的病因尚不清楚。
探索潛在的先前疾病對於預防LOAD流行至關重要。據我們所知,目前還缺乏對所有疾病與LOAD之間相關的研究。LOAD受多種因素的影響,因此同時探索與LOAD相關的既往疾病,並為這些與LOAD相關的疾病構建關聯網絡(圖一),對瞭解LOAD的病因會有幫助。
圖一:與晚發型阿茲海默型失智症相關的先前疾病路徑分析模型。國際疾病分類碼,第九次修訂代碼顯示在方框中
本研究的機器學習程式自動發現許多與LOAD有相關的先前疾病,這些疾病與過去研究的發現一致。本研究認為精神疾病、聽力損失、前庭系統和功能性消化系統疾病可能在LOAD發病機制中起重要作用。
本研究團隊所開發的「AI醫學科學家」機器學習程式,已發表4個不同疾病主題的研究論文而得到成功驗證,能以低成本並快速地提供醫學科學家們有關重大疾病成因的訊息。
參考文獻
原文出處:Liao J. Y., Lee C. T., Lin T. Y., Liu C. M. Exploring prior diseases associated with incident late-onset Alzheimer's disease dementia, PloS one 2020: 15: e0228172
https://doi.org/10.1371/journal.pone.0228172
李子奇教授使用大型衛生資料庫進行研究,已發表列名第一或通訊作者SCI/SSCI大數據統計分析論文達50篇以上,其中有部份論文刊登於JAMA network, British Journal of Psychiatry等知名學術期刊。李教授的研究興趣在於開發大數據統計分析程式,結合自行研發的高效率分析程式、流行病學與基因體學的研究方法,並以實際資料庫進行分析程式的驗証,實証醫學資料庫在嚴謹的方法學架構下的臨床醫學研究潛力。