大話腦影像之二十四:任務態分析方法總匯——你還停留在單變數的激活時代嗎?
- 2020 年 2 月 24 日
- 筆記
自1991年以來,Task-fMRI作為人腦功能研究的主流方法在人腦功能定位、功能分割、神經解碼、功能網路分離等方面做出了卓越的貢獻。雖然目前的Task-fMRI都是基於EPI快速成像序列的掃描方法,但是第一篇Task-fMRI的研究卻是基於美國哈佛麻省總醫院的貝利維爾(JohnW. Belliveau)博士使用注射造影劑的血液灌注MRI的方法完成的。他在給予受試者視覺刺激的前後各了做一次腦血容量(CBV)的造影,然後將兩次所得的腦血體積影像進行相減,就清楚地觀察到了有視覺刺激時局部腦血體積在視皮層的增加。 但這篇最早的任務態研究恰恰體現出了在任務態研究中最重要的兩個特點。第一是「巧思」,這依賴於你對研究問題的深入了解和靈活解決問題的能力,這些能力來源於大量的文獻日積月累的思考和可能與生俱來的天賦。因此,其時間成本的代價是巨大的,在這個時間就是金錢,快發堪比搶跑的「科研快時代」,有沒有更加經濟的做法呢?
答案是當然有。這就要看第二個特點——「靈活地使用技術和方法」。在貝利維爾博士所處的階段,還沒有很好的方法來實現對大腦中腦活動進行觀察的方法,但是他通過對血液灌注方法的靈活使用完成了這一開創性的工作。他的成功引發了世界範圍的腦功能磁共振成像技術的研究熱潮。次年,依賴血氧(BloodOxygenation Level Dependent,BOLD)訊號來觀察人腦活動的實驗就取得了突破。人腦功能定位的研究幾乎成為了當時最熱門的研究的問題,對視覺、聽覺、運動功能、執行功能以及後續的更精細的認知功能、語言功能等方面的研究佔據了核磁相關的研究大部分江山。
但是,現在簡單的單變數功能分析已經不再能獲得較大的影響了,一方面此類分析是基於組別水平的單變數分析,其對研究問題的探索依賴於認知加減法的嚴格計算或者因素分析的變數控制,其推斷過程發生在組水平,對個體被試的大腦加工模式利用能力低下;另一方面,該類方法依靠於Univariate Analysis Mean的分析路徑,其對單個體素內的血氧訊號變化均值的關注從神經生理學角度看,其一未考慮「功能柱」式組織的皮層構築帶來的局部腦區的多個體素之間的相互影響,其二未考慮人腦在加工同類物體的不同對象時,即使是加工該類物體資訊處理的腦區其具體的編碼方式也是不同的,例如Haxby et al.,2001的研究發現利用多體素的激活資訊可以對被試看到的物體進行解碼,可以預測被試看到的物體是「鞋子」還是「瓶子」。而依賴於單個體素內均值的分析方法即使使用考慮了人腦中神經元(其實是細胞)cluster的組織形式進行cluster層面的校正也只能看到「鞋子」和「瓶子」那基本一致的激活結果。因此,如果在今天的研究中,你還停留在全腦的基於體素的單變數的分析方法時代,你可能就要被「out」了。今天,我們給大家較為全面的介紹一些能夠更好的挖掘Task-fMRI實驗數據的分析方法以及對應的工具包,幫助大家能夠在設計出好的實驗的基礎上,更加有效的分析數據,輸入的挖掘研究價值。
1. 解密人腦加工的方法——MVPA( MultivoxelPattern Analysis )
與基於GLM模型和實驗設計矩陣進行統計推斷的單變數全腦分析方法不同,多體素模式分析(Multi-voxelpattern analysis, MVPA)其實質是尋找在不同實驗條件下具有高度可重複性的大腦活動的空間模式。從其本質看,MVPA其實是一個有監督的分類問題(或者預測問題),這個分類器試圖探測到由fMRI觀測到的大腦活動的空間模式與實驗條件之間的關係。

圖1 多體素表徵同一功能不同對象的空間編碼模式

圖2 MVPA分析方法的流程示意圖
從理論看MVPA是比較複雜並且難以用簡單的話語解釋清晰的,我們來通過圖2來解釋一下MVPA方法是怎麼進行操作的,它為什麼能夠解碼大腦中的加工資訊。首先,在看下圖前我們需要幾個基本知識。第一,我們必須清楚,fMRI的訊號變化是由於血液動力學和代謝調節相關的神經活動引起的,Bold的反應主要反映的是驅動神經元活動的突觸輸入,而不是它們的資訊輸出,因此,通過對輸入刺激的觀察可以模擬大腦神經元的突觸輸入活動。第二,神經活動的分布模式能夠通過對多個體素的訊號的觀察和分析進行推斷的。我們看圖一,視覺區域對不同顏色的圓環可能是通過同一個加工區域的多個不同的體素的編碼資訊的不同來實現對不同顏色的識別的(由於fMRI是基於體素單位的,因此這裡我們使用體素一詞來代替神經元),如圖一中人腦對藍色圓圈和藍綠色圓圈可能使用了枕頁皮層的相同區域進行加工,但是在該區域內通過這些體素上的不同編碼(圖1中九個小方塊的顏色深度不同代表編碼值不同)來實現對兩種顏色的區分,因此,我們可以通過對視覺皮層多個體素的Bold訊號(實際操作中往往是通過不同體素上的beta資訊來進行進一步操作的)的空間表徵來區分開兩種顏色在人腦中的表徵。在知道了這兩個基本資訊後,我們來通過圖2進一步看MVPA的分析方法是如何實現在全腦中尋找到對特定對象的基於多個體素的編碼模式。
在圖2中,我們對每個被試都進行了四個run的掃描(實際操作中應保證盡量多的數據資訊),每個run中都呈現A、B兩種刺激(Block或Event設計都可以),我們的目的是通過MVPA方法可以找到大腦中能夠對A、B兩種刺激的區別敏感的區域(即能夠通過如圖1的多個體素的不同編碼方式對這兩種刺激類型進行區分的腦區)。首先我們需要A、B兩種刺激的onset時間和duration時長,然後使用這些資訊建立全腦激活模型(即圖中activity maps),我們通過search-light(中文翻譯不傳神,因此使用英文,我們後續會介紹這種方法)的方法來在全腦激活模型中尋找能夠通過多個體素的不同weight對A、B兩種刺激進行分類的腦區,可以使用機器學習中的不同方法(如最常用的SVM方法,或者線性模型也可以,還有一些其他方法)來通過前三個run的數據訓練模型,使其能夠尋找到全腦激活圖中哪些區域是對這兩種刺激的表徵分類敏感的。在訓練後,我們使用第四個run的數據進行模型的測試(如果數據較少,也可以考慮使用k折交叉驗證來進行),來評估模型的特異度和敏感性。
也就是說,MVPA方法就是一種考慮了個體的大腦的神經訊號編碼方法的機器學習方法。這種方法目前已經取得了很多的研究成果,並且被大量使用。接下來,我們來看哪些工具包可以更好的實現MVPA的分析方法。
關於任務態MVPA及機器學習相關內容,可點擊以下文字了解:
第六屆任務態fMRI專題班(重慶4.8-13)
首先來看基於MATLAB的工具包,早期常用的工具包是PRoNTo(http://www.mlnl.cs.ucl.ac.uk/pronto),這款工具包的優點相當明顯,但是其缺點也同樣明顯。優點在於該工具包是介面化的,並且使用邏輯相當清晰,使用起來難度較低,但仍舊能夠實現基於線性模型或者SVM方法的分類或者預測分析。該工具包存在多個網上教程,但網上教程一般都比較簡略,對於很多軟體細節介紹不清,這裡給大家分享一例較好的教程http://www.tanxingcai.com/ai/2016.html。以便感興趣的朋友學習。該軟體的缺點就在於由於是介面化軟體,所以靈活性差很多,不能實現較為靈活的操作分析,同時,該軟體提供的方法也比較少,在目前的研究中已經不如以往的使用率了。
接著是近年來較火的CosmoMVPA工具包(http://www.cosmomvpa.org/),該工具包由英國班戈大學的研究者開發,與Pronto不同,該工具包沒有介面,並且提供了比Pronto複雜的多的分析方法,該工具包的維護是非常及時的,引用量高。但是難度較大,需要對MATLAB語言有較好的掌握才可(自學的前提下)。因此,這裡還推薦另一款相對簡單些的工具包,TDT,The Decoding Toolbox,(https://sites.google.com/site/tdtdecodingtoolbox/),該工具包的引用量同樣在150以上(排除用了但沒引用的),並且上手難度較低,主要是因為該工具包的函數使用較為簡單,整個分析步驟較少並且計算速度要快上不少(網站上說的,但是從demo data的測試看,可能確實如此)。
最後是基於Python的工具包——PyMVPA(http://www.pymvpa.org/)。該工具包的開發是很早的,並且有著良好的維護。它被用來簡化大型數據集的模式分類分,該包提供了一些高級的常用的處理步驟和一些常用演算法的實現,而且它不僅僅局限於神經影像學領域,也可以用於其他數據。這些基於程式碼實現的工具包其Manual是主要的學習途徑,但這個包也確實有人進行了不系統的教程的翻譯和內化,感興趣的同學可以查看https://blog.csdn.net/cocosion。以上兩個MATLAB包則沒有。
2. 跨越方法差異的鴻溝——RSA(Representational Similarity Analysis表徵相似性分析)
MVPA的方法可以讓我們在一定程度上對大腦的神經輸入進行解碼,一探大腦的奧秘,但是只做到這樣仍舊是不夠的。因為MVPA方法只能夠幫助我們解讀大腦是如何對這些刺激做出反應的,但我們仍舊不清楚系統神經科學的三個主要研究分支:腦活動測量、行為測量和計算建模之間的定量關係。這主要是由於不同的方法其理論基礎、測量精度和測量維度等方面的不同導致的,我們如果要進行不同方法的綜合,從傳統方法出發就會涉及不同維度的映射和轉換,將使得分析過程複雜而更加難以解釋。
因此,為了彌合不同分析方法之間的各種差異和分歧,一種從活動模式本身抽象出來,並計算表徵差異矩陣(RDMs)的方法開始幫助我們更好的去理解腦活動測量和行為測量之間的關係,並幫助我們進行更好的計算建模。這種方法就是Representational SimilarityAnalysis,表徵相似性分析。
為了能夠從特定經驗模式的觀察中抽象出來,我們需要一種與模式(即測量方法,如fMRI和EEG的測量就完全不同,但對象都是大腦的神經活動)無關的方法來描述大腦區域的表現。這樣的表徵方法將使我們能夠闡明不同的模式在多大程度上提供一致或不一致的資訊。我們可以通過比較活動模式的不同矩陣來聯繫大腦活動測量和資訊處理模型。該類方法避免了對顯式的不同空間要進行對應映射或從一種模態到另一種模態的轉換的需要。
該方法通過RDMs表示大腦或模型中給定表徵所攜帶的資訊。通過對實驗中觀測到的神經活動的定量相關,然後比較其RDMs和基於行為建立的RDMs之間的關係來進行分析。
我們通過一張圖來對這種方法進行簡單的了解:

圖3 表徵相似性分析
如圖三所示,在圖中心的表徵相似性矩陣(其實應該表徵差異矩陣,也就是RDMs)可以由不同模態的數據所建立,然後通過不同方法建立其RDMs後,去尋找不同RMDs之間的關係就可以回答計算模型、行為表現以及神經反應之間的關係,例如可以使用計算模型來神經反應得出的模型進行預測。
一般,fMRI的RSA常常通過選定興趣區域(ROIs)來分析不同的刺激中喚起的fMRI反應之間的響應相似性。對於每個ROI,計算並圖形化地顯示代表不同實驗條件的分散式活動模式對之間的距離度量(通常使用correlation來衡量此處所說的距離),從而建立RDMs。RDMs中存儲的距離資訊通常使用多維標度(MDS)圖來可視化,同時,也可以使用全腦通過search-light的方法進行一階的RSA分析,而不是直接使用二階分析的結果通過ROI來計算RDMs。行為和計算模型的RMDs的建立則較為簡單。
其實RSA與多體素模式分析是很相似的,以上的Cosma MVPA、PyMVPA以及TDT都提供了RSA的分析途徑。這裡給大家推薦一個簡單的分析工具,RSA_fMRI_matlab(https://github.com/CCN-github/RSA_fMRI_matlab),該工具包依賴於TDT和spm12,提供了相當便捷的計算方法。並且提供了練習腳本,感興趣的朋友可以自行學習。
最後,在MVPA分析和RSA分析中都能看到search-light的身影,那這種方法到底是什麼意思呢?Search-light演算法的最初想法源於Kriegeskorte等人(2006)的一篇論文,隨後被大量研究使用。最常見的用途是把大腦按照不同大小(這裡是需要自己根據自己的實驗自定義的)的球形區域進行分割,然後對大腦中每個感興趣的球形區域(ROI)進行完整的交叉驗證分析。該分析會生成一個(通常)分類精度的映射,該映射通常可以用某種方法實現,比如我們前文寫到的MVPA方法和RSA方法,可以理解為類似於GLM統計輸出,可以用來進行推斷和分析。
總結:
本文分析了基於多體素的分析方法,對MVPA分析和RSA分析方法進行了較為簡單的介紹和分析。同時,介紹了許多常用的並且上手難度不一的方法給大家,感興趣的同學可以認真學習。最後,Search-light這種常用的分析思路在當前研究中已經大量使用,也建議大家認真掌握。