nCovMemory項目已上升到github中文趨勢榜首
- 2020 年 2 月 9 日
- 資訊
2月9日訊,一個於6天前創立的github開源項目“nCovMemory”,已經上升到github中文趨勢榜的首位,項目累計已有200次提交,並收穫了4千以上的標星。
nCovMemory項目(https://github.com/2019ncovmemory/nCovMemory)的中文名稱是“2020新冠肺炎記憶:報道、非虛構與個人敘述”,旨在為研究人士提供方便自然語言處理的相關資料庫。一個完整的條目從可信的信源收錄內容,包括日期,原始URL,archive,截圖 四個要素,並且不收錄評論、分析、科普等類別的作品。
無獨有偶,連線(wired)網站也於昨日發表一篇文章,闡述AI如何利用機器學習程式分析網站、新聞報道和社交媒體來跟蹤冠狀肺炎,自然語言處理可以用於解析社交媒體上發布的文本,例如,區分討論新聞的人和抱怨其感受的人。哈佛大學醫學院首席創新官約翰·布朗斯坦(John Brownstein)稱,“我們試圖了解整個人口中正在發生的事情。” 約翰·霍普金斯大學的研究人員則根據官方數字和已確認的病例,對病毒在全球的進展進行了可視化處理。
英國南安普敦大學教授安迪·塔特姆(Andy Tatem)及其同事最近使用了搜索公司百度提供的智慧手機的匿名歷史數據,來模擬人群在病毒出現後的幾天內如何從武漢遷出。實際上,隨著北上廣深的確診人群所被發現的小區的資訊公開,更多精準的社區數據已開放出來。還有一些數據是個人資訊,比如中國移動近日也推出了漫遊地查詢公益服務,通過發送cxmyd到10086,即可自查本人15天之內達到的地區。
在github上搜ncov關鍵詞,目前已有多達779個版本條目產生,開發者正在貢獻他們的熱情和才能,當然還有充足的時間。