Techo開發者大會丨智慧化與沉浸式將成視覺媒體的未來趨勢
- 2019 年 11 月 13 日
- 筆記
雲、物聯網、5G、人工智慧……接踵而至的前沿技術,開發者們是如何進行天馬行空的創意和極限突破?11月6日—7日,首屆Techo開發者大會在北京召開。在前沿技術探索X論壇上,騰訊多媒體實驗室總監李松南發表了《視覺媒體的今天與未來-智慧化與沉浸式》的主題演講,圍繞視覺媒體的發展現狀以及未來發展趨勢展開分析,以視覺媒體的實際應用為例,從智慧化與沉浸式兩方面分享了騰訊多媒體實驗室的研究領域及實際落地應用,並表示,會持續進行技術優化,為用戶帶來更好體驗。
Techo開發者大會由騰訊雲發起,致力於開發者的能力成長和實踐創新,旨在通過匯聚全球頂尖行業專家和技術愛好者,搭建一個開放、中立、活躍的技術交流平台。本屆大會聚集來自全球的5000多位開發者,並邀請超150位業界大咖圍繞前沿技術發展進行分享和交流,是一次真正面向全球雲計算領域開發者和技術愛好者的年度盛會。

視覺媒體的智慧化趨勢
新媒體時代人們接收到的內容越來越豐富,用戶個性化特徵日益明顯,優質的內容、合理的分發無疑是影片網站吸引用戶的重要手段。
近幾年,在內容生產、分發和管理三個方面湧現出了許多人工智慧媒體應用,作為在音影片領域具有長久規劃的實踐者,騰訊多媒體實驗室正在努力實現從生產到消費全方位視覺媒體的智慧化,把媒體呈現的內容和最主要的媒介——影片、影像、聲音演變為數據,並藉助深度學習技術實現更加智慧化的建模,為企業帶來更優質的音影片處理以及理解服務,為個人用戶帶來更佳的多媒體消費體驗。

在人工智慧的賦能下,多媒體實驗室通過結合傳統影像影片處理以及深度學習技術,提供了多種視覺媒體的處理能力,如降噪、超分、增強、去壓縮失真等;通過使用基於多模態的深度學習技術,在媒體生產、雲服務,媒體消費全流程中解決處理、編輯、審核、管理等應用問題,實現視覺媒體的品質增強和內容理解。
智慧雲剪輯是騰訊多媒體實驗室的眾多研究領域之一,並且已經成功應用於國慶七十周年的閱兵直播中。「通過對歷史閱兵影片的學習,時間上精準定位不同方陣間隔之處,精準拆條;圖片分類上精準識別領導人、海軍方陣、陸軍方陣、群眾方陣,以及方陣間隔等;音頻識別上識別「向右看」口號和音樂,最終基於以上多模態時序資訊,實現智慧剪輯。」李松南介紹,智慧雲剪輯在國慶閱兵中實時幫助完成拆條工作,短時間內為央影片App輸出更多優質素材。
優化技術,為用戶帶來沉浸式體驗
在5G技術影響下,沉浸式體驗是未來視覺媒體另一重要特徵。在打造沉浸式新媒體這一領域,騰訊多媒體實驗室始終走在技術前沿,不斷探索未來資訊傳遞的多種可能性,把OMAF、DASH等標準研究成果融入產品,從採集、傳輸、轉碼、播放、互動等多端帶給用戶沉浸式感官體驗。
目前,騰訊多媒體實驗室已經引入國際最新360影片標準,針對VR影片壓縮傳輸等技術壁壘進行工程化實驗和XR(VR,AR,MR)互動技術落地探索,並聯合在線教育、影片雲聯合推出VR教育業務。李松南表示:「站在5G的風口,騰訊多媒體實驗室未來將會針對實際業務場景持續研發,保持領域內技術領先,同時為XR系統提出解決方案,在融媒體、新媒體等更多更豐富的場景中實現落地 。」
互聯網平台創造了一個海量資訊自由開放流通的公共領域,也把各類資訊和數據匯聚到平台之中,隨著5G的落地應用,讓海量數據高速率、低延時傳輸成為可能。騰訊多媒體實驗室將會持續完善音影片的傳輸、處理以及理解技術,實現從看見、看清再到看懂,讓工具更懂用戶,推動數字媒體的繁榮發展。