東京奧運會完美收官,來看看這屆奧運會都有哪些人工智慧黑科技!

東京奧運會閉幕式

8月8日晚,雨後東京灣的天幕上出現了「雙彩虹」,新國立競技場一片歡騰。16天前,在這裡,全球見證了奧林匹克五環旗的緩緩升起。過去16天里,在奧林匹克精神的感召下,上萬名運動員在東京奧運會拼搏、交流,情同與共,共同創造新的歷史。

本次奧運會中國代表團共收穫頗豐,令大家印象深刻的,遠遠不止那些獎牌,有太多名場面值得回味!小堂致敬所有為國出征的奧運健兒,你們是最棒的!

除了運動健兒們在賽場上拼搏的身影之外,本次東京奧運會上亮相的前沿人工智慧技術,也是格外的引入矚目,讓我們一起揭秘這些人工智慧技術吧!

01 首次應用的人臉識別技術

本次奧運會首次使用了人工智慧面部識別系統,主要用於識別包括運動員、志願者、媒體、工作人員等眾多奧運會現場參與者。可以做到即使有多人快速通過,也能順利地自動完成照片比對和認證。由於疫情、夏季氣溫等客觀因素,用人臉識別技術加快身份驗證和進場速度,就顯得更加重要。

人臉識別技術是基於人的臉部特徵,對輸入的人臉影像或者影片流,首先判斷其是否存在人臉,如果存在人臉,則進一步的給出每個臉的位置、大小和各個主要面部器官的位置資訊。然後生成專屬於個人的獨特程式碼並依據這些資訊,進一步提取每個人臉中所蘊涵的身份特徵,並將其與已知的人臉進行對比,從而識別每個人臉的身份。雖然機器並沒有辦法分辨人臉,但數據可以讓AI做到。人工智慧需要大量標記的人臉數據對模型進行訓練,並不斷優化得到一個誤差更小、更可靠的人臉識別系統。

人臉識別數據解決方案

數據堂擁有多色人種人臉多姿態數據、多人種人證對比數據等數據集,在面對多色人種人臉識別問題時,能提供給客戶業界領先的人臉識別數據解決方案。

例舉:多色人種人臉多姿態數據

20000餘人參與數據採集,人種多樣性包括黑色種人、白色種人、黃色種人、棕色人種,每人採集29張影像(28張多光照、多姿態、多場景圖片+1張證件照),**標註準確率達97%**可用於人臉識別等任務。

02智慧駕駛服務車跑在「奧運村」

東京奧運會中的智慧駕駛汽車

本次奧運期間智慧駕駛汽車的行駛,無疑是一大創舉。如具有L4智慧駕駛級別的e-Palette無人駕駛小巴,作為奧運村內的循環巴士,負責接送奧運會相關人員;同樣具備L4級別智慧駕駛能力的豐田Concept-i,是奧運聖火傳遞的列隊車和馬拉松比賽的先導車。

智慧駕駛汽車是通過車載感測系統感知道路環境,自動規划行車路線並控制車輛到達預定目標的智慧汽車。它是利用車載感測器來感知車輛周圍環境,並根據感知所獲得的道路、車輛位置和障礙物資訊,控制車輛的轉向和速度,從而使車輛能夠安全、可靠地在道路上行駛。

智慧駕駛數據解決方案

在智慧駕駛場景下的語音交互、視覺感知領域中,數據堂可以提供**版權數據集、訂製採集標註服務、可私有化部署的標註平台。**通過高品質的訓練數據協助客戶改善智慧駕駛AI模型,以創造更加安全舒適的駕乘體驗。

例舉:街景目標語義分割數據集

該數據集包括萬餘張照片共30萬餘框街景目標語義分割數據。數據在中國市區及鄉村道路場景下採集。數據多樣性包括多種場景、多種天氣分布、不同時間段、不同解析度。在標註方面,對街景圖片上的5類目標(28個子類)進行多邊形框標註。該數據可用於自動駕駛領域相關任務。

03人工智慧裁判給選手打分

人工智慧打分輔助系統

本屆奧運會採用了人工智慧打分輔助系統。該評分系統通過向選手的身體及其周邊投射紅外線,完成動作追蹤。這個評分系統就會根據運動序列預測,做出目標檢測、目標跟蹤和目標識別。如此一來,就可以為每一位運動員提供專業的評分意見,協助他們調整運動的姿態。

在人工智慧學習的過程中輸入很多之前的比賽數據,讓人工智慧去學習運動員的各種動作,在正式比賽中與學習的數據進行比對就可以進行打分。

個性化數據訂製服務

針對不同客戶的研發需求,數據堂可提供專業的數據集訂製服務。數據堂現有多套專業數據採集設備、工具和環境,項目經理擁有豐富的採集及品質管控經驗,可以滿足客戶多種場景與類型的數據採集需求。在標註方面,現有3個大型標註基地、5000名以上經驗豐富的專業標註人員可以支援語音、影像、影片、點雲、文本等專業數據標註訂製服務

04實時翻譯實現無障礙溝通

語音翻譯終端

為了本次奧運會松下公司開發了一個具備語音翻譯功能的小型終端設備,翻譯語言可達10餘種。在翻譯機的演示中有這樣有趣的一幕:一名外國男子在體育場弄丟錢包之後,搭載面部識別功能的攝影機發現了該男子,志願者通過使用掛在脖子上的多語種語音翻譯機與該男子進行了對話,最終成功幫助他找到了錢包。

實時語音翻譯的過程相對複雜,需要經過語音識別、語言理解、對話管理、語言生成、語音合成這五大步驟。人工智慧訓練的過程也相對複雜,首先將準備好的各種語音識別數據錄入到人工智慧學習系統後,人工學習軟體會在這些對話和環境涉及到的單詞中搭建一個統計模型。當用戶說話時,軟體會在該統計模型中尋找相似的內容,之後應用到預先「學到」的轉化程式中,使得音頻轉換為文本再從文本轉換成另一種語言。從而實現實時翻譯。

語音識別數據解決方案

在訓練人工智慧進行語音識別的過程中,數據堂現有的英語、法語、俄語等17種語言共60000小時的高品質的語音數據集可以為語音識別模型提供非常好的數據解決方案。

例舉:北美英語語音數據集

該數據集共有300餘位北美地區發音人參與錄製,內容包含短語和句子,場景豐富,貼近生活,錄音環境來自安靜的室內,錄音設備使用均衡包含PC、手機等,**識別準確率達95%**該數據集適用於北美英語語音識別等應用場景。

不只剛剛落下帷幕的東京奧運會,伴隨著科技進步,人工智慧已經開始在安保、醫療、社會服務等生活中的方方面面大放異彩。數據趨動,期待在下一屆奧運會中見到更多有AI身影