大數(shù)據(jù):“互聯(lián)網(wǎng)+”醫(yī)療的基礎(chǔ) 五大應(yīng)用場景
來源:新芽NewSeed 時間:2015-11-20 14:56:05 [報告錯誤] [收藏] [打印]
醫(yī)療大數(shù)據(jù)的主要來源
隨著醫(yī)療衛(wèi)生信息化建設(shè)進(jìn)程的不斷加快,醫(yī)療數(shù)據(jù)的類型和規(guī)模也在以前所未有的速度迅猛增長,甚至到了在很大程度上無法利用目前主流軟件工具,在合理的時間內(nèi)達(dá)到擷取、管理并整合成為能夠幫助醫(yī)院進(jìn)行更積極目的經(jīng)營決策的有用信息的地步。而且,如此具有特殊性、復(fù)雜性的龐大的醫(yī)療大數(shù)據(jù),其搜集如果僅靠個人甚至個別機(jī)構(gòu),那基本是不可能完成的任務(wù)。那么,這些數(shù)據(jù)到底是怎么產(chǎn)生的,又都來自于哪里呢?經(jīng)過簡單的梳理,我們大致可以把他們歸檔在以下4個框架里:
(1)病人就醫(yī)過程中產(chǎn)生的信息。從患者進(jìn)入醫(yī)院開始,掛號環(huán)節(jié)便將個人姓名、年齡、住址、電話等信息輸入完全了;隨后在醫(yī)生就醫(yī)環(huán)節(jié),病患的身體狀況、醫(yī)療影像等信息也將被錄入數(shù)據(jù)庫;看病結(jié)束以后,患者買單結(jié)算的過程中,又將有費用信息、報銷信息、醫(yī)保使用情況等信息被添加到醫(yī)院的大數(shù)據(jù)庫里面。這將形成醫(yī)療大數(shù)據(jù)最基礎(chǔ)卻也是最龐大的原始資源。
(2)臨床醫(yī)療研究和實驗室數(shù)據(jù)。臨床和實驗室數(shù)據(jù)整合在一起,使得醫(yī)療機(jī)構(gòu)面臨的數(shù)據(jù)增長非常快,一張普通CT圖像含有大約150 MB的數(shù)據(jù),一個標(biāo)準(zhǔn)的病理圖則接近5 GB。如果將這些數(shù)據(jù)量乘以人口數(shù)量和平均壽命,僅一個社區(qū)醫(yī)院累積的數(shù)據(jù)量就可達(dá)數(shù)萬億字節(jié)甚至數(shù)千萬億字節(jié)(PB)之多。
(3)制藥企業(yè)和生命科學(xué)。藥物研發(fā)所產(chǎn)生的數(shù)據(jù)是相當(dāng)密集的,對于中小型的企業(yè)也在百億字節(jié)(TB)以上的。在生命科學(xué)領(lǐng)域,隨著計算能力和基因測序能力逐步增加,美國哈佛醫(yī)學(xué)院個人基因組項目負(fù)責(zé)人詹森·鮑比就認(rèn)為,到2015年,將會有5000萬人擁有個人基因圖譜,而一個基因組序列文件大小約為750MB。
(4)智能穿戴設(shè)備帶來的健康管理。隨著移動設(shè)備和移動互聯(lián)網(wǎng)的飛速發(fā)展,便攜式的可穿戴醫(yī)療設(shè)備正在普及,個體健康信息都將可以直接連入互聯(lián)網(wǎng),由此將實現(xiàn)對個人健康數(shù)據(jù)隨時隨地的采集,而帶來的數(shù)據(jù)信息量將更是不可估量的。
醫(yī)療大數(shù)據(jù)的特性:大數(shù)據(jù)性+醫(yī)療性
如此規(guī)模巨大的臨床實驗數(shù)據(jù)、疾病診斷數(shù)據(jù)以及居民行為健康數(shù)據(jù)等匯聚在一起所形成的醫(yī)療大數(shù)據(jù),已然呈現(xiàn)出其作為大數(shù)據(jù)的特性,即:
(1)數(shù)據(jù)規(guī)模大(volume)。例如一個CT圖像含有大約150MB的數(shù)據(jù),而一個基因組序列文件大小約為750MB,一個標(biāo)準(zhǔn)的病理圖則大得多,接近5GB。
(2)數(shù)據(jù)結(jié)構(gòu)多樣(variety)。醫(yī)療數(shù)據(jù)通常會包含各種結(jié)構(gòu)化表、非(半)結(jié)構(gòu)化文本文檔(XML和敘述文本)、醫(yī)療影像等多種多樣的數(shù)據(jù)存儲形式。
(3)數(shù)據(jù)增長快速(velocity)。一方面,醫(yī)療信息服務(wù)中包含大量在線或?qū)崟r數(shù)據(jù)分析處理,例如,臨床決策支持中的診斷和用藥建議、流行病分析報表生成、健康指標(biāo)預(yù)警等;另一方面,得益于信息技術(shù)的發(fā)展,越來越多的醫(yī)療信息被數(shù)字化,因此在很長一段時間里,醫(yī)療衛(wèi)生領(lǐng)域數(shù)據(jù)的增長速度將依然會很快。
(4)數(shù)據(jù)價值巨大(value)。毋庸置疑,數(shù)據(jù)是石油,是資源,是資產(chǎn),醫(yī)療大數(shù)據(jù)不僅與每個人的個人生活息息相關(guān),對這些數(shù)據(jù)的有效利用更關(guān)系到國家乃至全球的疾病防控、新藥品研發(fā)和頑疾攻克的能力。
而除了大數(shù)據(jù)所具有的特征(即volume,variety,value,velocity)外,醫(yī)療大數(shù)據(jù)還具有多態(tài)性、不完整性、時間性及冗余性等醫(yī)療領(lǐng)域特有的一些特征。
(1)多態(tài)性醫(yī)療大數(shù)據(jù)包括純數(shù)據(jù)(如體檢、化驗結(jié)果)、信號(如腦電信號、心電信號等)、圖像(如B超、X線等)、文字(如主訴、現(xiàn)/往病史、過敏史、檢測報告等),以及用以科普、咨詢的動畫、語音盒視頻信息等多種形態(tài)的數(shù)據(jù),是區(qū)別于其他領(lǐng)域數(shù)據(jù)的最顯著特征。
(2)不完整性醫(yī)療數(shù)據(jù)的搜集和處理過程經(jīng)常相互脫節(jié),這使得醫(yī)療數(shù)據(jù)庫不可能對任何疾病信息都能全面反映。大量數(shù)據(jù)來源于人工記錄,導(dǎo)致數(shù)據(jù)記錄的偏差和殘缺,許多數(shù)據(jù)的表達(dá)、記錄本身也具有不確定性,病例和病案尤為突出,這些都造成了醫(yī)療大數(shù)據(jù)的不完整性。
(3)時間性患者的就診、疾病的發(fā)病過程在時間上有一個進(jìn)度,醫(yī)學(xué)檢測的波形、圖像都是時間函數(shù),這些都具有一定的時序性。
(4)冗余性醫(yī)學(xué)數(shù)據(jù)量大,每天都會產(chǎn)生大量信息,其中可能會包含重復(fù)、無關(guān)緊要甚至是相互矛盾的記錄。
上一篇:美國醫(yī)院這樣討好“土豪”患者 你怎么看?
下一篇:未來八大醫(yī)療新技術(shù),亮瞎雙眼!