頭禿元兇「真面目」首次被揭穿!鵝廠程式設計師立功了

好消息,好消息。

打工人的噩夢,脫髮的元兇,它的高清大頭照現在科學家扒!出!來!了!

便便聞起來臭 吃起來卻......
就是它,脫髮之源SRD5A2(II型5a還原酶)↑↑↑

這是SRD5A2的高解析度三維蛋白質結構首次被破解,並且解析度達到了2.8埃(1埃=10-7毫米)。

也就是說,療效更好的防脫新葯,現在有了研發的關鍵靶點。

便便聞起來臭 吃起來卻......

同時,知名治脫藥物非那雄胺的防離線制也在這項研究中被揭示。

這一來自南科大、匹茲堡大學、新加坡A*STAR研究所和騰訊AI Lab的成果已經登上了Nature Communications。

其中,AI還立下了一樁大功。

具體如何,快來一起圍觀:

禿如其來的真兇

熬夜禿,不熬夜的,也禿了。

引起脫髮的原因很多。

但對於二三十歲就禿了頭的年輕人群來說,攻擊範圍最廣、最頑固的元兇,是雄性激素脫髮。

引起雄脫的原因,就是毛囊殺手——DHT(二氫睾酮)。

人體內的睾酮(男女體內都有)在SRD5A2的作用下,可進一步代謝為與毛囊雄激素受體結合能力更強的DHT。

便便聞起來臭 吃起來卻......

DHT進入細胞後,會對代謝系統產生作用,使作為能量源的ATP無法產生,從而無法進行毛髮的蛋白合成。毛母細胞因此失去活力,角質化形成休止期毛髮,大概三個月後就會脫落。

在對抗脫髮的鬥爭中,人們早就了解到SRD5A2還原酶是導致雄脫的幕後真兇,也偶然間發現了治療前列腺增生的非那雄胺有抑制SRD5A2的作用,並將它作為治療雄脫的主要藥物。

便便聞起來臭 吃起來卻......

但直到最近,SRD5A2的高解析度蛋白質結構才首次被破解:

與細菌甾醇還原酶MaSR1不同的是,SRD5A2具有獨特的七次跨膜結構,由6個環連接:

便便聞起來臭 吃起來卻......

團隊根據羥基側富含的正電荷殘基,將羧基末端的環(C-loop)面對細胞質,將氨基末端環(N-loop)面對內質網腔。

此外,氨基末端殘基C5N與環4(L4)中的C133L4形成二硫鍵,這表明氨基端側面對的正是內置網腔位置,這是因為細胞質部分擁有還原性環境。

至於為什麼非那雄胺(Finasteride)能夠抑制SRD5A2,首先要從SRD5A2的作用講起。

便便聞起來臭 吃起來卻......

圖a表示的是SRD5A2通過還原睾酮的雙鍵,將睾酮轉化為二氫睾酮。

而非那雄胺的作用,則是通過本身結構中的側鏈(圖b中的R基),連接到SRD5A2的醯胺基鏈,形成二氫非那雄胺(DHF),提前預支掉SRD5A2的還原作用。

便便聞起來臭 吃起來卻......

在蛋白質結構3D示意圖中,粉紅色標出的部分就是二氫非那雄胺,而與之鏈接的青色部分,是SRD5A2的醯胺基鏈,也就是通常還原性輔酶II中的主要功能性結構NADP。

你可能會問,既然已經發現了針對雄性激素脫髮的有效治療藥物,再做如此深入的基礎研究,有什麼重要性?

其實,了解蛋白質的微觀結構,能夠更好地摸清它的性質,當然就能根據這些性質針對性地利用。

比如,目前的非那雄胺並不是治療雄性激素脫髮的完美方案。

首先,非那雄胺具有一定的副作用風險,比如有概率引起男性陽痿,按照美國FDA記錄的數據,這個概率在2%左右。

而且,停葯之後,沒了預支SRD5A2還原作用的非那雄胺,脫髮很可能複發。

除了引起陽痿、療效反彈,非那雄胺還有一個很大的局限性,即女性不能使用,一是因為確實沒什麼效果,二是會對生理周期產生影響。

而了解了SRD5A2的結構和非那雄胺作用機制,可以讓科研人員模仿類似機制研製出副作用更輕的替代藥品,或者從基因側入手,抑制SRD5A2的表達。

不僅如此,對於SRD5A2活性失調引發的各種疾病,這一成果也有著重要的參考價值。

如何破解SRD5A2真面目

所以,研究人員們具體是如何得到SRD5A2的高解析度結構資訊的呢?

從頭摺疊

想要破解SRD5A2的真面目,主要的技術難點在於,它具有獨特的7次跨膜結構,與人類全部已知結構的蛋白質差異較大,難以通過常用的「模板建模」方法獲得初始構型,來解析晶體數據。

於是,研究人員基於騰訊 AI Lab開發的tFold工具,採用了從頭摺疊(de novo folding)的方法。該方法可以不依賴於模板來預測蛋白質結構。

具體而言,參照蛋白質結構預測演算法trRosetta,首先,根據序列比對文件來預測氨基酸之間的距離和朝向分布,並將其轉化為勢能。

然後,用這一結果作為約束條件,與粗粒度的能量優化一起輸入蛋白質建模工具Rosetta。

最後,根據Rosetta能量,選擇滿足約束條件的最佳結構。

便便聞起來臭 吃起來卻......

在這個實現過程中,tFold工具提供了三項技術輔助,進一步提高了從頭摺疊方法蛋白結構預測的精度:

騰訊 AI Lab研發的多數據來源融合(multi-source fusion)技術,用來挖掘多組多序列聯配(multiplesequence alignment, MSA)中的共進化資訊。

主要是藉助多個不同的MSA(多重序列對比)搜索工具,在不同的參數、不同來源的蛋白序列資料庫下,得到的具有多樣性的MSA,然後再採用一種深度學習技術將其包含的共進化資訊給融合起來。

深度交叉注意力殘差網路(deep cross-attention residual network,DCARN),能大幅提高殘基對距離、取向矩陣等重要蛋白2D結構資訊的預測精度。

其核心在於利用互相交叉的2D注意力機制,來更有效的捕捉遠程的殘基對相互作用。這種2D注意力機制的表現能力,比通常的深度卷積神經網路更強。

模板輔助自由建模(Template-basedFree Modeling, TBFM)方法,將自由建模(Free Modeling, FM)和模板建模(Template-based Modeling, TBM)生成的3D模型中的結構資訊加以有效融合,從而提高最終3D建模的準確性。

其核心是,將TBM得到的3D模型中的殘基對2D結構資訊,以一種輸入特徵的方式,添加到預測2D結構特徵的深度交叉注意力殘差網路當中去,更好的幫助該網路進行2D結構特徵的預測。

這樣,即便在某些情況下TBM得到的3D模型精度不高,但其中的部分殘基對結構資訊(例如某些很保守的距離,或者取向)依然可以被有效的利用,從而更好的幫助FM進行精確的摺疊。

值得一提的是,預測SRD5A2這個蛋白,tFold只花費了2小時左右的時間。

X射線數據收集和結構測定

研究人員還在美國阿貢國家實驗室收集到了SRD5A2蛋白質晶體的X射線衍射數據。並使用HKL2000軟體對來自5個晶體的數據集進行了處理和合併。

為了確定晶體結構的相位,研究人員採用從頭摺疊結構模型作為分子置換的搜索模型,使得SRD5A2的結構精度達到了2.8埃。

One More Thing

現在,tFold公測版本已通過騰訊雲深智葯平台官網對外開放,蛋白質結構預測、虛擬篩選、分子生成、ADMET預測等功能都可以免費使用。

便便聞起來臭 吃起來卻......

量子位已經體驗了一把,效果大致是醬嬸的,預測速度也挺快:

頭禿元兇「真面目」首次被揭穿:鵝廠程式設計師立功了

如果你也感興趣,不妨親自一試~

最後,祝各位打工人頭髮健康

白頭髮拔一根長十根?多年疑惑終於有答案了

Tags: