Google將把生物多樣性研究人工智慧引入Tensorflow Hub
- 2019 年 11 月 1 日
- 筆記
機器學習演算法在生物多樣性研究中有很多,但大都沒有正確的歸因或監督。為了提高學術水平,Google表示,它將發布與全球生物多樣性資訊基金(GBIF)、自然主義者和Visipedia合作開發的機構人工智慧工作流程。這家科技巨頭的研究人員表示,該工作流程將支援跨團隊的數據聚合與協作,同時確保公司遵守標準化的許可條款,使用兼容的文件格式,並為手頭的任務提供公平、充分的數據覆蓋。
「機器學慣用於物種識別的前景即將實現,這揭示了它在生物多樣性研究中的變革潛力。」訪問教師Serge Belongie和Google研究工程主任Hartwig Adam在一篇將於荷蘭萊頓生物多樣性下次會議上發表的學術文章中寫道,「國際研討會的特色比賽,多以發展最先進的分類演算法,根據野生動物相機陷阱的影像壓制花卉標本和植物標本表。這些競賽產生的令人鼓舞的結果,會激勵我們將生物多樣性數據集和ML模型的可用性,從車間規模擴大到全球範圍。」
工作流程將由兩部分組成:GBIF打包的數據集,以及由Google與Visipedia培訓和發布的模型。前者將被審查,以確保它們滿足基準線許可和引用要求,它們將通過數字對象標識符(用於唯一標識對象的持久標識符或句柄)發布,並通過國際標準化組織的DOI引用圖進行鏈接。與此同時,後者將與TensorFlow Hub(Google的機器學習模型公共存儲庫)的文檔一起提供,其中將包含關於出處、體系結構、許可證資訊等諸多資訊,以及在用戶提供的影像上運行的互動式模型演示。

Belongie和Adam表示:「學術研究傳統的核心是引用和歸屬通用慣例,因此,當ML將其觸角延伸到生命科學領域時,它應該把這些慣例的適當對應物也帶來。更廣泛地說,人們越來越意識到道德、公平和透明度在ML社區中的重要性……我們期待著與全球各地的機構合作,以實現機器學習在生物多樣性方面的創新應用。」
機器學習由來已久,在各個領域中皆頗有建樹,生物領域中應用的例子也是屢見不鮮,但關於多樣性的研究目前尚處於起步階段,Google的探索,無論成果如何,皆會為該領域積累重要的經驗。