眼動研究模型:近似數估計中連續的中央凹累加

  • 2019 年 11 月 25 日
  • 筆記

請點擊上面「思影科技」四個字,選擇關注我們,思影科技專註於腦影像數據處理,涵蓋(fMRI,結構像,DTI,ASL,EEG/ERP,FNIRS,眼動)等,希望專業的內容可以給關注者帶來幫助,歡迎留言討論,也歡迎參加思影科技的其他課程。(文末點擊瀏覽)

研究亮點

在認知心理學、神經科學和應用教育研究中,人們如何估計數字量的問題至關重要。一般認為,對數字的估計是快速的,並且在視覺場景中並行發生。在這裡,作者展示了人們對數字的估計是由一系列的注視決定的,他們的平均估計和他們的精度都隨着他們的中央凹點數的增加而增加。這一機製表明,相當一部分將估計視為純數值測量的研究可能會遺漏一個重要部分:數值估計能力與控制眼球運動和注意力的機制密切相關。

文獻導讀

近似數系統(ANS)由於其在早期數學發展中的潛在重要性以及它在物種間的保守這一事實而引起了廣泛的興趣。ANS模型和ANS敏銳度的行為測量都假設數量估計是快速計算的,並且在整個視覺場景中並行計算。但是,本次提出的證據表明,ANS的估計在很大程度上是一系列累加機製作用於注視的產物。作者使用眼動儀收集被試在進行數量估計和辨別任務時的注視數據。結果發現,我們能夠使用他們的注視數據來預測被試的數字估計:即隨着注視點數的增加,平均估計數也會增加,估計誤差也會減小。一個詳細的基於模型的分析表明,注視點對估計數量的貢獻是外圍點的兩倍;人們不會「重複計算」複雜的注視點;他們也不會根據場景中固定區域的比例進行調整。作者提出的累積機制解釋了顯示時間對估計的影響,以及對低估數量偏差的早期發現。

引言

從嬰兒期開始,人類就配備了一個近似數系統(ANS),允許不精確的數量估計和比較。個體的ANS的敏銳度通常是根據其韋伯分數w來量化的,w是一個實數,反映了噪聲是如何以數字尺度進行表徵的。具體地說,ANS的一個流行的心理物理模型假設一個數n由一個平均數n和SD w*n的高斯函數表示,因此一個較低的w意味着一個真實度較高的系統。

然而,一些研究混淆了ANS的簡單圖像。一些研究表明,個體的韋伯分數高度依賴於任務。事實上,韋伯分數的重測信度很低,即使使用相同的任務進行測量。數量估計也受到刺激的非數值特徵的影響,例如場景中的聚類程度。最後,數量估計的精度會隨着刺激持續時間的延長而提高,這表明ANS估計可能涉及某種時間過程。

儘管如此,先前的ANS計算模型已經在其體系結構中構建了速度和並行性。例如,許多主要的ANS模型是正反饋神經網絡模型,其中輸入是並行和瞬時處理的。本研究的目的是批判性地評估ANS是否應該作為一個快速且完全平行的簡單過程去描述。

作者的目標是通過行為實驗和模型驅動分析數值估計中可能涉及的時序機制。他們提出了一個模型和兩個實驗的行為數據,挑戰了標準的平行感知理論。該研究的結果為ANS評估提供了新的支持,該評估涉及跨視覺注視的順序整合。

作者分別進行了估計(實驗1)和辨別(實驗2)任務,在這些任務中,被試在不同的呈現時間中對數量進行判斷。作者使用眼動儀收集注視數據,以便可以測量被試的ANS估計是如何受到注視路徑的影響的。研究表明,ANS估計值是一個連續累積過程的結果,即估計值隨着中央凹點的增加而增大。個體的ANS敏銳度差異可能反映了認知過程的差異,而這些差異(注意力或視覺處理速度)與數字估計沒有直接關係。

材料和方法

實驗1

電腦屏幕為24英寸,長寬比為16:10,屏幕分辨率為1920×1200像素。每個被試都對屏幕進行垂直調整,以確保屏幕的中心與他們的眼睛水平對齊。被試距離屏幕26英寸。屏幕從左到右和從上到下分別與被試視野的38°和26°相交。眼動儀型號為:Tobii T60XL,採樣率60讀數/秒。使用Tobii的內置軟件對被試的眼睛進行校準。

呈現的每個點的半徑為10像素。圖像中的點密度範圍為0.01到0.07點/deg2。值得注意的是,點的大小恆定意味着不可能直接測試ANS估計是使用數字還是密度。每個trial顯示的點數在10到90個點之間(包括10到90個點)。實驗共有在4個時間條件,在每個條件下,被試都會看到16個(隨機選取)且在不同條件間相同的數字,數字隨機呈現。被試使用電腦上的鍵盤輸入他們的數字估計值。

被試

共有27名來自羅切斯特大學社區的成年被試,其中女性:15名,男性:12名。被試的年齡範圍為18-29歲。

程序

實驗共64個試次,4個block,每個block16個trial。4個block分別為四種時間條件:100;333;1000;和3000 ms。block的順序在被試間隨機分配。在每個trial中,都會顯示點,然後是噪聲mask。然後,被試用鍵盤在文本框中輸入他們答案,然後按回車鍵進入下一個trail。

在這項任務中,我們對被試進行了眼睛跟蹤,以確定他們的估計是如何受到他們注視路徑上的點數影響的。重要的是,屏幕覆蓋了一系列被試的視野(即根據被試的首次注視點的範圍先設定了點的位置),這確保了一些圓點可以從最初的注視點上看到,而其他圓點可以從周邊看到。

圖1 評估任務的階段,按順序排列

實驗2

實驗2是數字辨別任務。實驗2中使用的刺激材料的性質同實驗1(例如,兩者中的點具有相同的半徑)。隨機選擇十六對數字呈現給每個被試,數字對的比率(最大值的最小值)範圍:0.5~0.99。每個被試,在4個時間條件下使用相同的數對,隨機呈現。

程序

被試同實驗1。實驗開始前,給每個被試重新校準。在這項任務中,被試會看到兩個點,一個接一個,然後問他們認為哪種刺激有更多的點(按鍵盤上的1或2)。實驗包含4個條件,每個條件有16個trial(如實驗1),每個條件中兩個點的呈現時間分別為(100;100 ms),(100;1000 ms),(1000;100 ms)和(1000;1000 ms)。

我們預測,如果在這項任務中,ANS的估計也依賴於中央凹的積累,那麼被試會偏向於選擇呈現顯示時間更長的點。

結果

基本數字在心理物理學上的重複發現

圖2A顯示了平均估計值(y軸)如何隨顯示的數量(x軸)變化。該圖有兩個方面值得強調:首先,均值估計值隨數量的函數近似線性變化,這與韋伯的數制模型完全一致。第二,這顯示出低估較大數字的強烈趨勢。圖2B示出實驗1複製了ANS估計的第二個傳統特性:尺度可變性,其中估計誤差在幅度上線性增加。

圖2 A為估計值作為呈現的點數量的函數。

(B)被試估計值的標準差,作為呈現點數的函數。

(C)估計任務中各時間條件下的被試水平(黑色)和組水平(藍色)斜率。

(D)評估任務中每個時間條件下的被試(黑色)和組水平(紅色)韋伯分數。

C和D分別為從該模型中提取的各時間條件下的平均斜率(圖2C)和韋伯分數(圖2D)。組水平平均值用藍色表示,被試水平用黑色表示。如果被試的估計是無偏的,那麼組水平的平均斜率將是1(黑色虛線),如果時間沒有影響,組水平的平均斜率和韋伯分數(y軸)將在時間上保持不變(x軸)。相比之下,從圖2C中可以看出,當斜率小於1時,被試總是低估,但這種低估效應隨着時間的增加而減小。從最短到最長的時間條件下,被試的平均斜率增加約17%。這是數量隨時間累積的期望:報告的數量隨時間增加而增加。此外,他們的平均韋伯分數降低了約21% (表S1)。從圖2D可以看出,韋伯分數隨着時間的增加而減少。

更長的時間可以提高估計的均值和方差

為了評估時間是否影響了被試的回答,作者進行了層次回歸,以評估時間對平均估計和韋伯分數的影響,包括被試和組層面的回歸效果。該模型假設均值和SDs隨數量增加呈線性變化,符合韋伯定律。更具體地說,在顯示n個點的trial中,每個被試的平均估計值來自以β·n為中心的高斯分佈,並用SD w·β·n建模,其中β和w是層次擬合參數(補充材料SI)。

表S1 各條件組水平的回歸權重及其95%可信區間

估計的關鍵是中央凹

如果ANS估計是由跨眼跳的數量累積驅動的,那麼平均估計應該隨着中央凹的增加而增加。且當考慮中央凹時,時間沒有影響,也就是說,時間只是允許更多的眼跳。為了評估這一點,作者總結了在一次試驗中,在被試注視路徑中心5°範圍內(通常稱為「中央凹旁區域」)超過50 ms的點的數量。將在這段時間內看見的點視為「中央凹」。圖3提供了四個 trials示例,描繪了在顯示刺激時被試在屏幕上的注視路徑。填充點表示「中央凹」點。

圖3 一個被試在3s時間條件下的注視路徑,每個圖代表一個trial。所有點表示屏幕上顯示的點,填充的點表示為中央凹的點。標籤N/F/EN分別表示:顯示了多少點(N),中央凹點數(F),以及被試實際估計的數量(E)。

圖4A顯示了每個時間條件下的中央凹點的百分比。正如所料,時間越長,中央凹點越多。從最短時間到最長時間,中央凹點的平均比例增加了三倍以上(18-64%)。與時間效應是由中央凹點的累積引起的假設一致,當聯合考慮中央凹點的效應比例時,時間對估計的影響消失。圖4B顯示了估計值與真實數量之間的百分比偏差。這些線的重疊表明,當同時考慮到中心凹和時間時,不存在時間的影響。

圖4 (A)在組水平(紅色)和每個被試(黑色)上,中央凹點的比例(y軸)作為時間(x軸)的函數。

(B)估計數與點的真實數目(y軸)之間的百分比偏差,作為中央凹點百分比(x軸)的函數。顏色表示不同的時間條件。

(C)被試平均估計數的斜率(y軸)作為中央凹點百分比(x軸)的函數。

(D)韋伯分數(y軸)作為中央凹點百分比的函數

為了正式評估這一點,作者進行了第二次層次回歸,與上面報告的相同,只是它包含了一個協變量,即中央凹點的比例對每個被試估計的均值和方差的影響。此回歸顯示中央凹點的比例顯著影響被試估計值的平均值(圖4C)和韋伯比率(圖4D),並且當考慮中央凹點時,時間的影響消失。此外,當100%的圓點都在中央凹時,被試的估計幾乎沒有偏差(圖4C中的斜率≈1),這表明先前觀察到的低估偏差不是誤判,而是由於被試沒有將所有圓點都放入中央凹。在一項單獨的分析中,作者發現在每個時間條件下觀測到的中央凹對平均估計數的影響是單獨存在的(補充材料表S3)。

表S3各時間條件下中央凹對斜率影響的組水平回歸權重及其95%置信區間

因此,這些結果為1)ANS的低估計問題和2)時間效應的研究發現提供了另一種解釋。事實上,兩者都存在於中央凹點連續累積驅動數字估計的機制中。這一發現對韋伯比率作為數字認知測量的結構有效性提出了質疑,因為數字估計取決於有多少點恰好是在中央凹的,這是一種非數值的能力。

實驗2

圖5A顯示了被試在第二次顯示中的響應點數多於第一次的比例,作為第二次顯示相對於第一次顯示的點數比率的函數。回答第二次顯示更多的被試的比例是隨着兩者的比例增加而增加的。圖5B顯示出了準確性作為絕對比率(Min/Max)的函數。被試能夠分辨出5:6的比率,準確率約為75%。

圖5. (A) 被試回答第二次顯示有更多點的概率,作為比率N1/N2的函數,其中N1和N2分別是第一次和第二次顯示中的點的數量。擬合曲線(以及此顯示中的所有其他擬合)來自probit回歸。

(B) 準確度作為絕對比率(Min(N1,N2)=Max(N1,N2)的函數。

(C) 被試回答,在長-短(藍色)和短-長(綠色)條件下,第二次顯示更多的點,作為比率的函數。

(D)在長長(黃色)和短短(紅色)的情況下,準確度作為絕對比率的函數。

圖5C顯示了臨界條件下的響應曲線,其中,第一次和第二次顯示的時間不同,但是總的顯示時間是受控的(長-短和短-長)。正如預測的那樣,這些曲線之間的差異表明,被試選擇第二個顯示時,在顯示時間長和顯示時間短的不同情況下是有偏差的。圖5D表明了兩次顯示相同時間但總體呈現時間不同(短-短-長-長)的條件下的響應曲線。圖5D中觀測到的響應曲線的差異表明,長-長條件下的響應比短-短條件下的響應更準確。被試選擇第二次的比例在短-長條件下為62%,在長-短條件下為45%,正如預測的那樣。在短-短(56%)和長-長(57%)兩種情況下,被試均以中等比率選擇了第二次。

實驗2結果發現,中央凹點的比例對斜率和韋伯分數都有顯著的影響,並且與估算任務一樣,時間對斜率的影響消失了。時間對韋伯分數仍有影響,但影響程度大大降低。

ANS估計機制

接下來,作者開發了一個統計模型,該模型允許我們使用人們的行為數據來量化視覺輸入的不同成分對數值估計的影響。這個模型以參數化的方式使作者能夠測試關於ANS積累如何與視覺行為相關的各種先驗假設。首先,作者測試了幾個行為測量因素對估計數量µ的可分離貢獻。模型推導出各因素的權重。圖6A顯示了方程式的所有項,每個試驗的擬合參數是彩色的,行為測量變量是黑色的。

圖6 (A)µ:平均估計;Nfoveal:中央凹點數; Nperipheral:非中央凹點數; Afoveal:中央凹占屏幕中的面積百分比。Aperipheral:非中央凹占屏幕中的面積百分比。Ndouble:每個點算作1次以上中央凹點的數量。每個因素都有對應的參數量化其貢獻來估計µ。

(B)參數βfoveal和βperipheral捕獲視網膜中央凹和外圍對累計計數的貢獻。

(C)參數γfoveal和γperipheral捕獲被中央凹(Afoveal)和外圍(Aperipheral)屏幕面積百分比的標準化後的累積計數。

(D)時間變化下各因素對µ的貢獻。

該模型假設有五種成分對µ有貢獻。首先是中央凹點(Nfoveal)和非中心凹點(Nperipheral)的數目,它們分別由各自相應的回歸參數(βfoveal和βperipheral)加權。此外,作者測試了在首次眼跳後每個注視點算作1次以上中央凹點的數量(Ndouble, 加權參數βdouble)。最後,測量進入中央凹的面積(Afoveated)的比例。

為了使該模型適合於行為數據,作者再次使用了分層貝葉斯模型。通過對推斷參數的檢查,這讓他們可以從三個關鍵的方面來描述ANS估計的機制:

首先,通過比較βperipheral和βfoveal可以得知積累機制是否更多、更少或相等地依賴於中央凹和外圍觀察到的小圓點。這又反過來告訴我們,ANS主要是平行進行的,還是中央凹點(即累加)對觀測到的估計數貢獻更大。

第二,測試βdouble會告訴我們被試是否「doublecount」 重新進入中央凹的點:是(βdouble ≈ 1)或否(βdouble ≈ 0)。這將回答一個關於ANS累加的基本問題:它是基於單純的視網膜輸入,還是基於通過眼跳建立起來的基於空間的世界圖像。

第三,被試是根據他們的中央凹面積(γfoveated ≈ 1)重新調整他們的輸入,以校正他們有限的視覺樣本,還是,估計是一個沒有考慮場景的觀看量的更簡單的累加器(γfoveated≈0)。

圖6B顯示出了推斷的組水平和單被試水平的βfoveal(X軸)和βperipheral(Y軸)平均值。這表明中央凹點的貢獻大約是周邊點的兩倍。此外,βfoveal的值是∼1,這意味着人們在估計中確實將一個中央凹點計為「另一個點」。然而,有趣的是,外圍點確實提供了非零貢獻,這解釋了為什麼在非常快的呈現時間下可以進行ANS估計,儘管準確性較低。圖6C顯示γfoveal和γperipheral接近於零,表明了小面積得重新標準化。這一發現支持了作者的初步假設,即數量估計是基於積累,而不是使用在部分場景中觀察到的點的密度進行推斷的。最後,所有被試的βdouble都接近於0,表明在同一顯示器上多次看到同一個點對估計幾乎沒有影響。

圖6D顯示了在不同時間條件下(x軸),各因素對平均估計值(y軸)的相對貢獻,這是由模型推斷出來的。在0.1秒時,邊緣點和中央凹點對估計值的貢獻大致相等,在如此短的呈現時間內,它們對估計值的低估程度相當嚴重。然而,隨着呈現時間的增加,中央凹點對估計值的貢獻也越來越大,因此周邊點在3秒時對估計值幾乎沒有影響。重複計數在任何時間都幾乎不起作用。

總結

該研究表明,ANS(近似數系統)估計在很大程度上是一系列累加機製作用於注視的產物。完整的ANS估計需要整合視覺認知的各個方面,如注意力和眼動控制,以理解將視覺場景轉換為抽象的數字的認知機制。該研究可能能夠有效的修正我們以往對數字估計這一能力的傳統認識,加深我們對人類知覺轉化的認識程度。

原文:Cheyette, S. J., & Piantadosi, S. T.(2019). A primarily serial, foveal accumulator underlies approximate numericalestimation. Proceedings of the National Academy of Sciences, 201819956.doi:10.1073/pnas.1819956116