網課直播尷尬現場:老師講解摩擦力 竟「涉黃」被封
- 2020 年 2 月 19 日
- 資訊
被迫營業的“十八線主播”們又遇到了新難題——直播因“涉黃”遭封禁?
當樸實的人民教師,架上手機變身業務不熟練的網路主播;看慣沙雕直播的學生,正襟危坐把上網變成上課,一場大型的網課翻車現場拉開了序幕。
前不久,老師們還因為不熟悉直播軟體鬧出了許多笑話,現在,眼看新手主播們逐漸習慣了直播,直播平台“魔幻”的審核機制又給了新手主播們重重一擊。
直播教學涉黃?
其中,最冤的應該就是生物課了,不少生物老師無奈的表示:講了這麼多年課,沒想到自己一直處在涉黃邊緣。
我們簡單看幾個例子。
比如溫州某生物老師在上課時,講到精子、卵子以及生殖器官等等生物術語時便遭到了直播平台的封禁,真是又心酸又好笑。
同樣難受的,還有護理學校的婦產課程,剛開講 2 秒鐘就封,萬萬沒想到,從生物老師到涉黃只用 2 秒……
再比如,物理老師上課時講到物體的摩擦力的相互作用時也被封了,這和涉黃有什麼關係呢?這個操作真的是好魔幻……
其他敏感行為
當然,也有一些老師還未觸及到違禁詞,直播間也被封了。
比如有生物老師在講減數分裂時因為引入了一段其他平台的影片也被封了,虎牙還特地出了聲明,表明封禁原因是:引用了其他平台影片,觸發平台版權保護機制,並非是教學內容違規。
還有政治老師在講到一些政治敏感詞時,也遭到了平台的封禁。
但是在直播間抽煙的這位老師,估計誰都保不住了……
更迷惑的是,此前還有一些新聞爆出在直播平台吃香蕉、紅薯等也會被鑒定為涉黃,當然,老師們在直播中還沒有遇到這樣的情況,但我們大致可以猜測到這和直播平台的審核機制有關。
而網課這種正常教學涉黃的,其實應該屬於被直播平台鑒黃系統誤殺的情況。事實上,以影像識別技術為基礎的直播平台主要依賴 AI 鑒黃,但 AI 鑒黃對關鍵詞有很強的抓取鑒別能力,比如摩擦、用力,但對語境的把握卻不夠強,進而導致某些情況下的誤殺。
直播平台為何會誤殺?
網路直播行業經歷了井噴式爆發後,到現在依舊保持著持續火熱的態勢。但這一市場火爆的背後也暴露了一些問題,低俗內容屢見不鮮,其中涉黃是最為嚴重的一個現象。近幾年,相關部門已經針對這些亂象加大了打擊力度,因此基於互聯網直播平台的有害資訊檢測成為重中之重。
通常情況下,直播鑒黃會通過影片截圖、影像識別、語音技審、彈幕監控、關鍵字抽取等能力智慧識別色情內容。
其中影片直播內容的審查鑒定可以從以下幾個步驟:識別影像中是否存在人物體征,統計人數;識別影像中人物的性別、年齡區間;識別人物的膚色、肢體器官暴露程度;識別人物的肢體輪廓,分析動作行為;除了影像識別之外,還可以從音頻資訊中提取關鍵特徵,判斷是否存在敏感資訊;實時分析彈幕文本內容,判斷當前影片是否存在違規行為,動態調節影像採集頻率。
具體來看,直播時,它的數據是實時生成的,需要用到流媒體技術,包含影像、音頻兩大數據源,所用到的檢測技術也不一樣。首先會對直播中的音影片資源提取,分別交由影像處理模組和語音處理模組,針對影像數據我們要提取關鍵幀,針對語音數據,把影片數據中的音頻資源提取出來。
在影像識別部分要對影像預處理、影像分割,拿到有效的區域來檢測,在有害資訊識別檢測階段,會完成特徵提取、目標分類、判斷匹配,找出裡面涉黃、涉暴的資訊。
音頻的數據提取之後,上傳到到伺服器端。拿到音頻數據之後,第一步是音頻預處理(流媒體快取、斷句切分、統一格式、降噪處理),然後是內容檢測(語音識別、關鍵詞檢索、語音識別)。除了內容審核之外,還有其它的檢測,例如直播平台會對當前主播身份的確認、廣告檢測、語種識別等。而這種基於影像識別的影片涉黃檢測準確率可以達到 99% 以上,可以為影片直播平台節省 70% 以上的工作量。
值得注意的是,人工智慧的鑒定只能將海量影片/圖片中的疑似黃色內容篩選出來,它可以將審核範圍從無邊無際中圈出一個範圍,但並不能像人一樣理解每張圖片中內容的準確含義。因此,AI 鑒黃雖然替代了大量人力,但仍然不能完全替代人工,各大平台仍然保留有大量人工審核人員。很顯然,老師們在直播中被誤傷便是 AI 鑒黃師的功勞,而並非人工審核的結果。
不過,辦法總比困難多,直播不行改成錄播,全盤都上不行改成先上主課,教材和課件不行改成電子版作業,直播帳號被封就換個平台,總不能耽誤學生們的學習,但大家最期盼的還是希望疫情儘快結束回到學校上課。