微焦點(diǎn)X射線檢查系統(tǒng) Xslicer S
島津、富士通、富士通研究所共同研究成果:人工智能在質(zhì)譜數(shù)據(jù)處理中的應(yīng)用
株式會(huì)社島津制作所(以下簡(jiǎn)稱“島津制作所”)、富士通株式會(huì)社(以下簡(jiǎn)稱“富士通”)、株式會(huì)社富士通研究所(以下簡(jiǎn)稱“富士通研究所”)經(jīng)共同研究※1,成功開發(fā)出可應(yīng)用于大數(shù)據(jù)處理中的AI(人工智能)技術(shù),該技術(shù)在質(zhì)譜分析結(jié)果的解析過(guò)程中*。截至目前的所有研究成果,已在日前召開的“第11屆代謝組學(xué)研討會(huì)”上發(fā)表。
作為ICT(信息通信技術(shù))企業(yè),富士通為實(shí)現(xiàn)數(shù)字革新,不斷探究AI新型商業(yè)模式。作為分析儀器制造商,島津公司受客戶委托,致力于“實(shí)現(xiàn)復(fù)雜數(shù)據(jù)的高精度自動(dòng)解析”。訴求一致的兩家企業(yè)自去年11月起,開始推進(jìn)數(shù)據(jù)自動(dòng)化解析領(lǐng)域AI的共同研究。隨著儀器靈敏度、分析速度的不斷提升,用于疾病早期發(fā)現(xiàn)的技術(shù)確立、食品農(nóng)殘檢測(cè)等各領(lǐng)域研究以及品質(zhì)管理等用途的質(zhì)譜分析儀,獲得的數(shù)據(jù)量也急劇增加。在此影響下,被稱為“peak picking ”※2的數(shù)據(jù)解析方式成為作業(yè)工程中的一大瓶頸。由于較難實(shí)現(xiàn)*的自動(dòng)化,并且在一定程度上仍需手動(dòng)調(diào)整,該作業(yè)方式存在操作人員操作失誤或數(shù)據(jù)篡改的漏洞,各操作人員間的解析準(zhǔn)確率亦參差不齊。近年,在醫(yī)療及制藥領(lǐng)域,對(duì)排除屬人為屬性的高精度自動(dòng)化需求愈演愈烈。
為此,3家企業(yè)模仿腦神經(jīng)細(xì)胞的神經(jīng)網(wǎng)DEEP LEARNING(深度學(xué)習(xí))的適用性開展探討,欲通過(guò)活用AI解決上述問(wèn)題。但在研究過(guò)程中,遇到兩大難題:其一, 訓(xùn)練數(shù)據(jù)※3不充分;其二,將分析儀器輸出數(shù)據(jù)直接導(dǎo)入深度學(xué)習(xí)網(wǎng)絡(luò)后,無(wú)法開展學(xué)習(xí)訓(xùn)練。通過(guò)共同研究期間的不懈努力,島津成功開發(fā)出“可彌補(bǔ)訓(xùn)練數(shù)據(jù)不足的數(shù)據(jù)生成技術(shù)”,富士通?富士通研究所成功開發(fā)出“分析儀器輸出特征的圖像轉(zhuǎn)換技術(shù)”及“可學(xué)習(xí)熟練工解析訣竅的特征提取技術(shù)”。目前,已將通過(guò)上述技術(shù)生成的3萬(wàn)多條訓(xùn)練數(shù)據(jù)輸入深層學(xué)習(xí)網(wǎng),供其學(xué)習(xí)。
與經(jīng)驗(yàn)者手動(dòng)peak picking 結(jié)果比對(duì)后發(fā)現(xiàn),AI自動(dòng)peak picking 的錯(cuò)誤率為7%、未檢率為9%※4。即自動(dòng)peak picking 并不遜色于經(jīng)驗(yàn)者操作,相關(guān)結(jié)果達(dá)到可使用狀態(tài)。
在島津公司2017年4月開展的中期經(jīng)營(yíng)計(jì)劃中,制定了“致力*醫(yī)療、為預(yù)防、診斷、治療以及制藥領(lǐng)域提供革新產(chǎn)品及服務(wù)”的目標(biāo)。本次開發(fā)的AI,其zui初使用的“代謝組學(xué)”研究即為其中的一環(huán)。代謝組學(xué)是一種檢測(cè)代謝產(chǎn)物并根據(jù)其性狀特征對(duì)細(xì)胞開展檢查的生物技術(shù)。在生理?病理組織的解析、疾病生物標(biāo)志物的探索等領(lǐng)域備受矚目。
2015年11月,富士通將積累了超過(guò)30年的AI(人工知能)相關(guān)知識(shí)技術(shù),以“FUJITSU Human Centric AI Zinrai”形式公開發(fā)表,積極推進(jìn)面向各領(lǐng)域用戶、商品服務(wù)的AI實(shí)際應(yīng)用。目前,又在深度學(xué)習(xí)的全新領(lǐng)域聚焦“代謝組學(xué)”,積極開展可實(shí)現(xiàn)數(shù)據(jù)分析自動(dòng)化的AI研發(fā)。
島津與富士通的目標(biāo)為,2018年能將本次成功研發(fā)的AI技術(shù)導(dǎo)入質(zhì)譜分析儀器軟件。
※1 從大阪大學(xué)研究生院工學(xué)研究專業(yè)福崎英一郎教授、該校信息科學(xué)研究專業(yè)松田史生教授處獲得研究人員需求。在島津制作所、大阪大學(xué)開設(shè)以代謝組學(xué)分析技術(shù)研發(fā)為目的的“大阪大學(xué)?島津分析革新共同研究講座”。
※2 從質(zhì)譜分析數(shù)據(jù)(圖表)中,讀取峰寬及峰高的工程。
※3 供深度學(xué)習(xí)網(wǎng)絡(luò)開展學(xué)習(xí)的數(shù)據(jù)。對(duì)輸入網(wǎng)絡(luò)的數(shù)據(jù)及其輸出結(jié)果進(jìn)行編組。本技術(shù)應(yīng)用中,為分析儀器輸出數(shù)據(jù)與相應(yīng)經(jīng)驗(yàn)者peak picking 結(jié)果的比對(duì)組合。
※4 將經(jīng)驗(yàn)者手動(dòng)peak picking 結(jié)果稱作“正確范圍”,與AI自動(dòng)peak picking 結(jié)果“預(yù)測(cè)范圍”進(jìn)行比較。如兩者重疊率超過(guò)50%,則判斷為“匹配”,反之則為“不匹配”。在“匹配”情況下,除被正確檢測(cè)的峰值外,將預(yù)測(cè)范圍中出現(xiàn)、但無(wú)法與正確范圍匹配的項(xiàng)目定義為“錯(cuò)誤檢測(cè)”,將正確范圍中出現(xiàn)、但無(wú)法與預(yù)測(cè)范圍匹配的項(xiàng)目定義為“未檢測(cè)”。錯(cuò)誤檢測(cè)率計(jì)算公式為:錯(cuò)誤檢測(cè)數(shù) / (檢測(cè)數(shù)+錯(cuò)誤檢測(cè)數(shù))、未檢測(cè)率計(jì)算公式為:未檢測(cè)數(shù) / (檢測(cè)數(shù)+未檢測(cè)數(shù))。