原創 圖靈基因 圖靈基因 2023-09-19 10:11 發表於江蘇

收錄於合集#前沿分子生物學技術

在最近的一項研究中,美國新罕佈什爾州漢諾威達特茅斯學院和Geisel醫學院的研究人員開發瞭一種用於表征學習的新的視圖生成方法。該方法采用聯合嵌入結構,增強瞭組織圖像的表示學習能力。

研究人員使用這種新的視圖生成方法分析瞭脂瀉病和腎細胞癌(RCC)的兩個組織學圖像數據集。這些驗證研究表明,他們的方法持續改進瞭斑塊級和切片級分類性能的各種指標。

“我們的研究結果表明,在某些情況下,表示學習方法可以與完全監督的方法不相上下,甚至更好。這意味著我們提出的方法為開發計算病理學模型提供瞭一條潛在的途徑,當訓練模型的標記數據有限時,該方法可以幫助病理學傢進行診斷和預測。”該研究的資深作者、達特茅斯Geisel醫學院副教授Saeed Hassanpour博士說。

他補充說,這種方法通過減少病理學傢標記數據集所需的時間和精力,降低瞭開發計算病理學模型的門檻。

該報告發表在《Journal of Pathology Informatics》上,文章標題為“HistoPerm: A permutation-based view generation approach for improving histopathologic feature representation learning”。

越來越多的證據表明,深度學習可以改善組織學圖像分析的病理工作流程。然而,標準的計算機視覺模型需要標記圖像和感興趣區域的大型數據集,這對於組織病理學圖像來說是困難且耗時的。

此外,帶註釋的組織病理學數據集通常包含切片級別的標簽,而不是補丁級別的標簽,相關區域代表整個切片圖像的一小部分,不適合現有的自監督方法。

Hassanpour博士指出:“表征學習方法是計算機視覺領域顯著進步的背後原因,但這些進步尚未轉移到病理學領域。之前的工作直接從計算機視覺中使用表征學習方法,而沒有進行修改,使其更適合病理圖像的獨特方面。”為瞭應對這些挑戰,作者開發瞭HistoPerm,這是一種用於表示學習的靈活的與模型無關的視圖生成方法,通過利用標記和未標記的數據來改進組織學圖像分類。

具體而言,作者旨在開發一種技術,可以利用豐富的未標記的組織學圖像數據,以及有限的標記數據,來學習改進的組織病理學特征表示。他們的目標是表明,與目前僅依賴標記數據的表示學習方法相比,這可以帶來更好的下遊分類性能。

作者使用聯合嵌入架構開發瞭一種視圖生成方法,用於增強組織學圖像的表示學習。他們將這種方法稱為“HistoPerm”。

HistoPerm是一種與模型無關的視圖生成技術,它可以對從整張切片組織學圖像中提取的斑塊的增強視圖進行排列,以提高表示學習和分類性能。這種方法利用瞭組織學切片的弱標記性質,其中標記適用於整個切片,但隻有小區域與類別相關。

Hassanpour博士解釋說,基於聯合嵌入的表示學習方法對配對視圖進行操作,其中每個視圖代表源圖像的唯一增強。該方法的目標是學習一個模型,該模型將每個配對視圖映射到潛在空間中的同一區域。

與傳統使用的自然圖像不同,組織學圖像通常是弱標記的——也就是說,它們包含切片級別的標簽。此外,組織學切片可能包含全切片水平標記陰性的區域(例如,切除的腫瘤切片中的正常組織)。

Hassanpour博士補充道:“考慮到這些復雜性,我們將屬於同一切片級別標簽的切片中的斑塊視為潛在空間中映射在一起的候選視圖。我們按切片級別標簽進行排列,因此成對的視圖現在隻屬於同一個切片級別標簽,而不屬於同一源圖像。”

在評論這種方法的新穎性時,他說:“之前的工作使用瞭標記或未標記的數據,這降低瞭他們提出的方法的靈活性,在共享方案中使用標記和未標記的數據是獨一無二的。”

該團隊研究瞭HistoPerm在脂瀉病和RCC兩種組織學圖像數據集上的表現。為此,他們采用瞭三種常用的基於聯合嵌入架構的表示學習方法:BYOL,SimCLR和VICReg。

這些分析表明,將HistoPerm添加到現有的表示學習框架(如BYOL, SimCLR和VICReg)中,幾乎在所有情況下都可以提高脂瀉病和RCC數據集的斑塊級和切片級分類性能。具體而言,HistoPerm將BYOL、SimCLR和VICReg在脂瀉病數據集中的斑塊級分類準確率分別提高瞭8%、3%和8%。在切片級水平上,HistoPerm將BYOL、SimCLR和VICReg在脂瀉病數據集中的分類準確率分別提高瞭6%、5%和2%。此外,對於BYOL、SimCLR和VICReg,整合HistoPerm的模型分別比完全監督基線模型高出6%、5%和2%。

在RCC數據集中,使用HistoPerm將BYOL和VICReg的斑塊級分類精度提高瞭2%,將SimCLR的斑塊級分類精度提高瞭1%。此外,盡管使用瞭未標記的數據,但與完全監督的基線相比,HistoPerm的集成將模型的分類精度差距降低瞭10%。

當被問及這些發現的意義時,Hassanpour博士指出:“這種方法在脂瀉病數據集上優於完全監督的方法,這表明HistoPerm可以使現有模型獲得以前使用未標記數據的模型無法獲得的性能。這可以減少病理醫生的註釋需求。”Hassanpour博士指出,未來的研究需要確定小批量對HistoPerm性能的影響,並檢查合並來自不同數據源的未標記數據的影響,以探索HistoPerm在不同制備和掃描程序的組織學數據集上的可推廣性。

他補充道:“在未來的工作中,我們計劃探索如何進一步減少標記數據的需求。這將使HistoPerm能夠用於更多標記數據受限的場景。”>>>關於我們<<<

圖靈基因面向科研工作者推出的 TB-1 數字病理切片掃描儀,自帶AI建模和模型解釋功能,有望幫助您發現更多細胞和組織空間結構規律。簡單易用,輕松構建原創模型,成本可控,門檻低聯系微信號:aipathology 郵箱:product(at)http://turingene.com