網路城邦
上一篇 回創作列表 下一篇   字體:
機器學習助力醫療,通過數據分析發現近6000種新病毒
2018/03/22 11:48:21瀏覽116|回應0|推薦0

機器學習助力醫療,通過數據分析發現近6000種新病毒

最近,研究者藉助AI 技術發現了近6000 種前所未聞的新病毒,這一工作已在3 月15 號由美國能源部(DOE)組織的一場會議中展示,成為了一種探索發現數量巨大、種類繁多的病毒的新工具。

儘管從人類健康到垃圾降解,病毒的影響力無處不在,卻很難被研究。科學家無法在實驗室培植絕大多數病毒,確定其基因序列的嘗試也多遭失敗,因為它們的基因組極小,且進化迅速。

近年來,通過將取自不同環境的樣本中的DNA 進行排序,研究者已經獲得了一些未知的病毒。為了確定目前存在的微生物,研究者蒐集了已知病毒和細菌的基因特徵,就如同文字處理器的「查找」功能會突出顯示文檔中包含特定字母的單詞。但這一方法經常失敗,因為病毒學家無法蒐集他們不知道的東西。機器學習解決了這一問題,因為它可以發現海量數據中的潛在模式。機器學習算法解析數據,從中學習,接著自動分類信息。

南加州大學洛杉磯分校的計算生物學家Jie Ren 說:「從前沒有研究病毒的好方法,但現在就不同了,我們有了新工具。」

上週日,美國能源部聯合基因組研究所(JGI)的計算生物學家Simon Roux 訓練計算機識別不常見的Inoviridae 病毒家族的基因序列。這些病毒生存在細菌中並改變宿主的行為:比如,它們會使引起霍亂的細菌即霍亂弧菌的毒性變得更強。Roux 在JGI 組織的會議上(加州,舊金山)展示了其研究,稱在他的研究開始前已識別到的基因組種類不到100 種。

Roux 展示了一個機器學習算法,該算法使用兩個數據集:一個包含805 個來自已知Inoviridae 的基因序列,另一個包含2000 個來自細菌和其他病毒的基因序列。算法可以找到一種方式來區分二者。

然後,Roux 向模型饋送大量宏基因組學數據集。計算機恢復了一萬多種Inoviridae 基因組,並將其分成不同種類的集群。這些集群之間的基因變異非常大,意味著Inoviridae 可能有很多家族。

病毒學習

在另一項獨立研究中,巴西聖保羅大學的生物信息學家Deyvid Amgarten 應用機器學習來在城市動物園的天然肥料堆中尋找病毒。他將算法設計為可以搜索病毒基因組的幾個可分辨特徵,例如給定長度的DNA 雙鏈的基因密度。經過訓練之後,計算機復原了幾種可能是新型的基因組,Amgarten 說。他將這個結果在JGI 會議上進行了展示。最後一步是學習這些病毒生成的蛋白質種類,然後檢查哪些蛋白質將加速有機物的破壞。「我們希望改善肥料的質量。」他說。

Amgarten是從去年報告的一項機器學習工具即Ren的團隊開發的VirFinder中得到靈感的。VirFinder被設計用於尋找DNA鹼基組合,例如DNA雙鏈中的AT或GC。Ren將算法應用到從健康人和肝硬化患者(由肝炎或慢性酒精中毒導致的疾病)的臉部取樣的宏基因組。機器將取樣的病毒完成了分組之後,該團隊注意到樣本中某些特定類型的基因組在健康人群中相對更少或更多,這意味著這些基因組相關的病毒可能導致了疾病。Ren的成果是一項很誘人的發現:生物醫學研究者長期以來一直很困惑,到底是哪些病毒導致了那些疑難雜症,例如慢性疲勞綜合症(也稱為肌痛性腦脊髓炎),以及炎症性腸病。

康涅狄格州法明頓市的基因組醫學傑克遜實驗室的免疫學家Derya Unutmaz推測,病毒可能觸發了一些毀滅性的反應,或者改變了人體微生物群系的細菌行為,從而使新陳代謝和免疫系統變得不穩定。Unutmaz說,通過應用機器學習,研究者可以發現患者體內仍被隱藏的病毒。此外,由於AI可以在大規模數據集中發現模式,該方法也許可以將病毒數據和細菌關聯起來,然後和症狀相關的蛋白質變化關聯起來。「機器學習可以揭示出我們甚至從沒思考過的問題。」Unutmaz說。

( 心情隨筆家庭親子 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=7038bb18&aid=111254824