“接下來是不是提問環節?我已經嗅到評委席上飄來的硝煙味......”
第一個開口的是來自生命科學院的周士博周老,他曾主動向院方領導提出想帶蘇雨眠幾人,結果沒成。
雖有遺憾,不過他尊重幾個孩子的選擇。
甚至隱隱有種刮目相看的意味。
“不忘師恩”誰都會說,但真正落實到行動的,又有幾個?
歐陽沒看錯人,也沒等錯人。
蘇雨眠值得!
周士博:“既然大家都這么謙虛,那就由我來起這個頭,權當拋磚引玉。蘇同學,你剛才著重講了midas這種新算法的基礎邏輯,以及具體運行思路和前端操作方式,卻沒提這種新算法出現的意義和可能帶來的積極影響,可以大致說一說嗎?”
蘇雨眠:“眾所周知,單細胞測序技術是近年來生命科學領域的突破性技術,能夠檢測單個細胞內的多種遺傳物質與功能分子,比如rna表達、蛋白質豐度和染色質可及性等等,從而揭示細胞在不同分子層面的異質性以及組學之間的關聯,有助于更加深入地理解細胞功能,探索生命發育和疾病發生等機制。然而——”
她話鋒一轉,“隨著測序技術的發展和測序數據的增長,不同組學組合、不同測序技術、不同測序樣本的‘馬賽克’式單細胞數據整合成為巨大的挑戰。”
周士博點頭:“確實如此。”
蘇雨眠:“您問midas出現的意義,我認為這應該是人類研究首次實現通用單細胞多組學馬賽克數據的模態對齊、數據補全、批次校正等整合功能,為構建大規模多組學細胞圖譜、實現大規模單細胞多組學分析與知識遷移提供了重要的原創技術......”
接著,是化學與分子工程學院的民受文,民教授——
“這種新算法對比從前的方法,有什么突出優勢嗎?”
這個問題很大,很泛泛,屬于“萬精油式”提問,套用到其他論文上也沒毛病。
但蘇雨眠還是想了想,認真答道:
“midas假設每個細胞的多模態觀測值是通過深度神經網絡從兩個與模態無關且解耦的隱變量生成......其輸入由不同單細胞樣本(批次)的表達矩陣和批次編號向量組成......因此可能存在不同的技術噪聲、模態組合和觀測特征......midas的輸出包括生物狀態和技術噪聲兩種低維表示的矩陣,以及對缺失模態和特征進行了補全并消除了批次效應的表達矩陣。s