熱點文章

基于心電算法自動分析準確性評價的心電數據庫

發布時間:2019-03-26 14:05:00      瀏覽  次

作者:王茜1,梁振士1,方丕華2,楊嘯林3,曹東芳2,劉俊2,李衛2,王楊2,楊紅2 ,張正國3

單位:1 北京市醫療器械檢驗所,醫療器械檢驗與安全性評價北京市重點實驗室;2 中國醫學科學院阜外醫院;3 中國醫學科學院基礎醫學研究所

〔關鍵詞〕算法;準確性;數據庫

基金項目:基金項目:首都衛生發展科研專項項目(編號:首發 2011-3001-04)

心電數據庫是對醫學研究、臨床診斷、疾病過程和預后判斷的寶貴醫學資源??蔀榕R床研究提供心血管流行病的資料;可為建立不同年齡、性別、種族的正常人群心電圖(electrocardiogram,ECG)特征提供依據;可探討某種心臟疾病情況下的心電圖診斷標準和評估心電圖的潛在價值等。

Iribarren 等 通過心電數據庫來探索短 QT 間期在兒科人群中患病率以及其與人口統計學參數關系;對 VA 心電數據庫的研究,使其發現從臨床和 ECG 中得到的參數是很好的男性患者病死率的預測因素,提高了診斷預防水平。美國國家衛生院及美國心、肺、血壓研究院通過規劃幾個大規模心血管病流行病學調查和臨床試驗,建立了國家級心電數據庫等。國內近年的基于大規模人群調查,提供了流行病資料的心電數據庫;有用于心電信息醫院管理的遠程心電監護系統的心電數據庫等 。

與此同時,心電數據庫對于產品的研發設計、性能評價也具有重要價值。心電圖在臨床的重要地位,以及計算機、電子等相關技術的發展,越來越多的心電圖機具有心電圖自動分析及診斷功能。這些有著各異的技術方法、模式和特點的心電算法,或是具有心電圖自動分析及診斷功能的心電圖機,其性能良莠不齊,自動分析結果可能會存在較大差異。

心電數據庫是評價其自動分析準確性的重要評判依據。相較于心電算法或心電圖機的飛速發展,在算法準確性評估領域,符合要求的心電數據庫發展較慢。特別是缺少采集自中國人的、格式開放、可用于心電算法自動分析準確性評估的標準十二導聯心電數據庫。國際電工委員會(International Electrotechnical Commission,IEC)在心電圖機的相關標準中提出,用于驗證心電圖形態輪廓和節律自動診斷算法的心電圖數據,應在預期使用的特定人群中采集。然而,可應用于此目的的心電數據庫存在應用需求和監管缺口。

我們結合北京優質資源(與中國醫學科學院基礎醫學研究所、中國醫學科學院阜外醫院合作),參考國外權威數據庫 CSE 心電數據庫,并根據相關標準要求,結合臨床實際及技術可行方面,從心電圖的形態和節律方向,設計實現了一種格式開放、經臨床專家確認、可用于心電圖機自動分析準確性的中國北方成年人標準十二導聯檢測心電數據庫。

1 需求分析與研究現狀

1.1 需求分析

1.1.1 應用需求

按照標準要求,應利用合適心電數據庫作為評價素材,來評價心電算法自動分析性能的準確性。為保證評價的可靠性、客觀性,國際上通行的做法是采用經臨床心電專家確定的心電數據庫。我國該類心電數據庫發展較晚,準確性評價多引用國外(歐美)的權威心電數據庫,這些數據庫的樣本采集自西方人種。然而,作為一種體表記錄的生理參數,心電圖存在人種差異和適用性等方面的問題。這也與臨床實踐相同,即 ECG 的參數與年齡、性別和種族可能都有關系??紤]到中國是一個幅員遼闊的多民族國家,人群生活習性不同,生理參數與西方人種更可能存在地域、種族差異。完全用西方人種的心電數據庫來評價心電算法自動分析性能對中國人心電圖的分析能力,無法衡量是否會有潛在風險。

另一方面,心電圖作為常規臨床診療技術手段之一,臨床與研究已經產生海量的心電圖數據。但由于絕大部分心電數據以產品制造商的專有格式進行儲存,存在格式壁壘,使得不同制造商的產品之間幾乎無法交換數據。開發算法準確性評估的素材,難點在如何建立格式開放(利于共享)、答案可靠的心電數據庫。

1.1.2 標準要求

不同研究方向對心電數據庫有著不同的要求,可用于心電圖機自動分析準確性評估的心電數據庫,還應滿足相關的醫療器械標準。行業標準 YY 0782:2010[12](轉化自國際標準 IEC 60601-2-51:2003)中對心電圖機的準確性性能評估所采用的數據庫要求如下:

(1)形態自動診斷準確性評估:驗證數據應從心電圖機適用的健康人群和心臟病患者數據中獲得。其中,用于測試評估分析型心電圖機的健康人群應該有標準的臨床診斷方法確定其沒有疾病,尤其是沒有心臟病,這些方法可能包括身體檢查正常、無心臟病癥狀、沒有患過已知的對心臟功能或形態會產生影響的疾病、條件允許情況下的運動心電試驗等。用于測試評估分析型心電圖機的心臟病患者要有非心電圖手段(心臟導管術、超聲心動圖等)來準確驗證其所患心臟病。標準同時提出,對于一些疾病,如正常、陳舊性心肌梗死、心室肥大,可以使用 CSE 診斷數據庫進行準確性驗證。

(2)節律自動診斷準確性評估:驗證數據應來自有代表意義的目標人群。包括竇性心律和心房顫動心律,以及心房撲動、交界性節律等主要節律,適用時還有房性期前收縮、房室傳導阻滯等更詳細的節律分類。這些心電圖的“真正”節律(用來)應由至少 1 名在心律失常分析方面受過培訓的心臟病專家,通過仔細觀察至少兩個同步導聯,每個導聯不少于 10 s 心電圖記錄的心房活動來確定。

1.2 研究現狀

目前歐美等發達國家已建立了一些采集自西方人種、可用于心電設備算法準確性評估的權威心電數據庫。包括MIT-BIH 心律失常心電數據庫、美國心臟學會 (American Heart Association,AHA)心電數據庫、心電圖通用標準 (Common Standards for Electrocardiography,CSE) 數 據 庫、ST-T 數據庫  和克瑞頓大學室性心律失常數據庫(Creighton University Ventricular Tachyarrhythmia Database) 等。

其 中CSE 數據庫可用于心電圖機算法準確性評估。該庫共有 3個子庫,其中的三導聯庫和多導聯庫可用于心電圖機間期自動測量準確性的性能評估,診斷庫可用于波形自動分類準確性的性能評估。目前已有超過 200 家研究中心和制造商使用了 CSE 3 個數據庫中的至少 1 個以上數據庫來評價心電算法。CSE 數據庫有正常、心室肥大、心肌梗死等部分形態診斷類別的心電圖,但沒有足夠數量的急性心肌梗死和心肌缺血心電圖。與此同時,CSE 數據庫里也缺少節律診斷信息,無法驗證算法的節律自動解析準確性。綜合來看,作為心電算法準確性的評估素材,在滿足標準要求的對形態或節律診斷分類識別方面,CSE 數據庫有一定的局限性。

國內能進行心電算法評估的數據庫很少。SDMU 心律失常心電數據庫  主要針對的是心律失常心電算法的準確性評價。中國人心血管疾病數據庫 (Chinese Cardiovascular Disease Database,CCDD)提供的臨床標注信息有各波起終點、QRS 波傾斜度特征和心拍標注。兩者均不能滿足用于評估心電算法或心電圖機節律和形態自動分類識別診斷的評估目的,而節律診斷和形態診斷則是相關標準對有自動分析功能心電圖機的要求,以及當實際產品適用時,對心電圖自動分類識別診斷的共性內容。

2 技術思路和方案設計

參照 CSE 診斷心電數據庫,并根據相關標準要求、結合臨床實際以及后期應用,我們設計制定并建立了中國北方成年人標準十二導聯心電數據庫。實現的總體技術方案見圖 1。

2.1 “考題”(心電圖)設計

2.1.1 規則

既然心電算法面對的心電圖有正常心電圖和異常心電圖兩類,評估用心電數據庫里也應含有具備典型性的正常和異常心電圖??紤]到相對于人種之間在同種診斷類別心電圖上可能存在的種族差異,正常和異常心電圖之間的差異可能會更大。因而,綜合考題代表性與研究成本兩方面因素,我們設計并實施的數據獲取規則如下:正常心電圖從有大數據支持的流行病調查資料里,根據年齡、性別、患病率等心臟病影響因素隨機抽樣獲得;而異常心電圖則考慮病種的覆蓋,盡量納入種類較全、數量較多的異常類心電圖。所有入庫的心電圖數據均通過倫理審查。其中,正常心電圖按照要求,通過臨床常規方法(采用包括常規體檢、無心臟病癥狀、無已知對心臟功能或形態學有影響疾病的病史)的診斷來證實受試者沒有心臟方面的疾病。異常心電圖要通過非心電圖的臨床方法來確認受試者所患心臟疾病的真實性,項目實施中所依據的非心電圖臨床方法有:超聲心動圖、心肌酶檢查、心臟導管術、血管造影、CT、心臟 MRI、心肌核素顯像等,同時還有受試者的既往病史資料及心電圖檢查時的用藥信息。

2.1.2 特征

心電圖每道數據的采樣率為 500 Hz,模擬信號頻響帶寬 0.05~150 Hz,幅度分辨力不劣于 5 μV,符合開發心電數據庫的推薦標準(由美國國家衛生院及美國心、肺、血液研究院特別專家小組給出)[21]。所有的心電圖數據均采用開放的 xml 格式進行數字化存儲。為了提高資源的可利用性,同時還提供以認可度高、開放的 MIT 兼容數據格式(每條記錄含 .dat 和 .hea 兩個文件,格式同 MIT-BIH 心律失常心電數據庫)和 txt 格式兩種存儲形式。

2.1.3 質控

所建庫中所有數據均由相對固定的專業人員使用可靠心電圖機采集。以減少可能引入、來自外部的非數據特性的差異。另外,數據庫中每條數據均經過至少 2 名有多年豐富經驗的臨床心電專家(來自阜外醫院)獨立進行典型性篩選,一致認為具有典型性者,方作為預備“考題”。

2.2 “參考答案”(臨床標注)設計

2.2.1 規則

庫中臨床標注的診斷有兩方面:形態診斷和節律診斷。由于在相關標準中,對異常心電圖只有大致的分類(節律)和部分的分類(形態),實施時,仍需進一步細化到合理、可實施的診斷分類。所以在參照 AHA/ACC/HRS 的心電圖標

準化及解析指南(2007)給出的診斷分類和術語名稱基礎上,我們進一步制定了合理、可實施的詳細心電圖診斷分類類別,并建立了一套心電圖編碼表,將之用于臨床數據采集、典型性篩選和標注。

按照建庫要求,標注時,臨床醫師根據臨床實踐,須仔細觀察至少兩個同步導聯、每個導聯 10 s 心電圖記錄的心房活動,對每一份心電圖,都會標注其形態診斷和節律診斷。臨床非心電圖手段的檢查資料、既往病史、用藥情況等會在提取各項信息后,與對應的心電圖關聯。醫師在標注時,會同時獲得這些與典型心電圖篩選、診斷標注關聯的臨床信息。這樣方式能在醫師標注時綜合參考多方面臨床信息,符合臨床實踐,進一步提高了標注的準確性。同時,我們以電子圖紙的軟件形式完成臨床工作,節省了大量紙版 ECG 標注、整理對比的工作和時間,提高效率,并減少了可能引入的誤差。

2.2.2 質控

為保證最終結果的可靠性,分兩輪實施標注工作:

第1 輪,每條數據由兩位經驗豐富的臨床心電專家進行獨立的篩選和標注診斷;而后逐一比對梳理提取不一致數據;

第2 輪,將第 1 輪中所有的不一致處,提交更高級心電專家或復審并確定最終診斷結果。

2.3 數據庫總體

最終入庫內容,除了含正常和異常心電圖作為評估心電算法的“考題”,其中每條記錄均經臨床心電專家進行獨立的典型性篩選,同時還有專家確認或復審一致的標注診斷作為評估心電算法的“參考答案”,共同構成可應用于心電算法對節律和形態自動診斷和分析性能評估的測試題庫(庫中總數據超過 1800 條)。另外,除心電圖數據及臨床專家標注的診斷信息之外,數據庫包含的相關信息還包括人口構成、心電圖記錄的時間等。按照標準要求,還包含非心電圖驗證手段的檢查結果等輔助信息。

無論是在心電產品研發階段還是在上市前的測試階段,在評估心電算法或有自動分析功能的心電圖機性能準確性的領域,心電數據庫的重要性毋庸置疑。準確性評價過程中,設備或算法通過對心電數據庫里心電圖的檢測、自動分析給出自己的結果,然后將其結果與數據庫中的參考答案進行比較和統計,從而得到算法對心電圖形態或節律的自動分析診斷準確程度的客觀量化評估。

按相關醫療器械標準要求,每種心電算法或每個企業應公布其用來進行準確性測試評估的心電數據庫信息,及其所能診斷的疾病種類的敏感性、特異性和陽性預測值。該要求對于已經有自有數據庫的心電圖機制造商來說,可以實現;但對于許多尚無自有數據庫的心電圖機制造商來說,西方人種的 CSE 心電數據庫有一定局限性,自己建數據庫又需要重復倫理審查、臨床采集、臨床確認評價等過程,耗費大量時間、人力、物力。而目前由于數據格式的壁壘,參考答案的煩瑣確認過程等原因,國內很少有格式開放、可用于評估目的的心電數據庫。

針對應用需求,結合臨床實際以及標準要求,本項目設計實現的中國北方成年人標準十二導聯心電數據庫,樣本全部采集自中國人,考題可以多種數據格式提供,便于使用,同時含有符合相關國際、國內標準規定的形態診斷和節律診斷、由心電專家結合心電圖與相關非心電圖臨床檢查信息綜合確認的“參考答案”,是一種可用于心電算法自動分析準確性評估的可靠資源。其可為心電圖機類制造商提供設計研發、性能檢測和臨床評價的依據,降低研發成本,提高性能評估驗證結果的有效性和客觀公正性。

[參考文獻]

[1]Iribarren C, Round AD, Peng JA LM, et al. Short QT in a cohort of 1.7 million persons: prevalence, correlates, and prognosis[J]. Ann Noninvasive Electrocardiol, 2014, 19(5): 490-500.

[2]Stavrakis S, Patel N, Te C, et al. Development and validation of a prognostic index for risk stratification of patients with early repolarization[J]. Ann Noninvasive Electrocardiol, 2012, 17(4): 361-371.

[3]楊嘯林,張靖,徐鋮,等 . 基于大規模人群調查的心電數據庫的構建 [J]. 中國生物醫學工程學報,2010,29(3):326-330.

[4]劉星,陳希超,汪覺民,等 . 遠程心電監護系統的設計與開發 [J].醫療衛生裝備,2007,11(28):55-56.

[5]IEC. IEC 60601-2-51: 2003, Medical electrical equipment -Part 2-51:Particular requirements for safety, including essential performance, of recording and analysing single channel and multichannel electrocardiographs[S]. Switzerland, 2003.

[6]Rautaharju PM, Surawicz B, Gettes LS, et al. AHA/ACCF/HRS Recommendations for the Standardization and Interpretation of the Electrocardiogram. Part IV: The ST Segment, T and U Waves, and the QT Interval A Scientific Statement From the American Heart Association Electrocardiography and Arrhythmias Committee, Council on Clinical Cardiology; the American College of Cardiology Foundation; and the Heart Rhythm Society Endorsed by the International Society for Computerized Electrocardiology[J]. J Am Coll Cardiol, 2009, 53(11): 982-991.

[7]Mansi IA, Nash IS. Ethnic differences in electrocardiographic intervals and axes[J]. J Electrocardiol, 2001, 34(4): 303-307.

[8]Mansi IA, Nash IS. Ethnic differences in electrocardiographic amplitude measurements[J]. Ann Saudi Med, 2004, 24(6): 459-464.

[9]Jain A, Tandri H, Dalal D, et al. Diagnostic and prognostic utility of electrocardiography for left ventricular hypertrophy defined by magnetic resonance imaging in relationship to ethnicity: the Multi-Ethnic Study of Atherosclerosis (MESA)[J]. Am Heart J, 2010, 159(4): 652-658.

[10]Macfarlane PW, Katibi IA, Hamde ST, et al. Racial differences in the ECG--selected aspects[J]. J Electrocardiol, 2014, 47(6): 809-814.

[11]Soliman EZ, Prineas RJ, Case LD, et al. Ethnic Distribution of ECG Predictors of Atrial Fibrillation and Its Impact on Understanding the Ethnic Distribution of Ischemic Stroke in the Atherosclerosis Risk in Communities (ARIC) Study[J]. Stroke, 2009, 40(4): 1204-1211.

[12] 全國醫用電器設備標準化技術委員會醫用電子儀器標準化分技術委員會 .YY0782-2010 醫用電氣設備 第2-51部分:記錄和分析型單道和多道心電圖機安全和基本性能專用要求 [S]. 北京:中國標準出版社,2010.

[13]Goldberger AL , Amaral LA, Glass L , et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals[J]. Circulation, 2000, 101: E215-E220.

[14]AHA database[EB/OL].https://www.ecri.org/Pages/default.aspx.

[15]Willems JL, Arnaud P, van Bemmel JH, et al. A reference database for multilead electrocardiographic computer measurement programs[J]. J Am Coll Cardiol, 1987, 10(6): 1313-1321.

[16]European ST-T Database[EB/OL].http://www.physionet.org/physiobank/database/edb/.

[17]Creighton University Ventricular Tachyarrhythmia Database[EB/OL].http://www.physionet.org/physiobank/database/cudb/.

[18]Rautaharju P. Eyewitness to history: Landmarks in the development of computerized electrocardiography[J]. J Electrocardiol, 2016, 49(1): 1-6.

[19]邵慶余,李橋,王永,等 .SDMU 心律失常心電數據庫的建立 [J].中國生物醫學工程,1996,15(1):54-61.

[20]Zhang Jia-wei, Wang L i-ping, L iu xia , et a l. Chinese Cardiovascular Disease Database (CCDD) and its Management Tool: proceedings of the 2010 IEEE International Conference on Bioinformatics and Bioengineering, 2010 [C].

[21]Norman JE, Bailey JJ, Berson AS, et al. NHLBI workshop on the utilization of ECG databases:preservation and use of existing ECG databases and development of future resources[J]. J Electrocardiol, 1998, 31(2): 83-89.

香港2020暂停搅珠 南京期货配资晓晓 广西快乐十分在线购买 网上一分钟开奖的11选5 配资平台173bx 安徽十一选五1982114 极速赛车怎么看走势选号 江苏7位数开奖结果查 心水号码一四五打一生肖 打云南快乐10分的技巧 北京pk10赛车官网下载