7大場景,帶你5分鐘讀懂自然語言處理

  • 2020 年 2 月 19 日
  • 筆記

提起自然語言處理,不少人會覺得陌生而遙遠。事實上,從獨立的漢字,擴展到連貫的詞語、句子、篇章,乃至新聞輿情,都離不開NLP的作用。接下來讓我們一起來了解一下,自然語言處理是如何在文字的世界裏大展拳腳的吧。

產品介紹

自然語言處理(Natural Language Process,簡稱NLP),是一款基於人工智能技術,為各行各業的企業和開發者提供的針對文本智能化分析及處理的雲服務,意在幫助用戶高效處理文本數據,實現數字化和智能化轉型。

產品深度整合了騰訊內部(包括AI Lab,信息安全團隊、AI平台部、翻譯君和知文團隊自研等)優秀的 NLP 前沿技術,依託于海量中文語料累積,全面覆蓋了從基礎到高級的智能文本處理能力。

產品功能

騰訊雲自然語言處理(Natural Language Process,NLP),前身為騰訊文智自然語言處理,現經過全新升級,正式發佈v1.0版本。

基礎版包括詞法分析、句法分析、篇章分析、向量技術、情感分析、文本糾錯、文本分類等;高級版包括敏感詞識別、文本審核等。

應用場景

01

社交媒體的用戶言論分析

在各類媒體平台和存在UGC的內容型社區里,有大量的用戶留言和評論,可以使用情感分析接口,對這些包含主觀信息的用戶言論進行情感傾向性分析,判斷用戶情感和態度的正向、負向和中性傾向,從而動態監測海量用戶的輿情變化,並為相關的輿情監控、話題監督、口碑分析和運營活動提供數據支持。

此外,還可以使用文本分類和關鍵詞提取接口,對用戶言論進行內容分類和評論觀點標籤提取,從而審核社交媒體的用戶行為數據。

02

網絡文本數據的敏感信息審核

信息爆炸時代,對於新聞媒體網站和信息流App中的海量文本數據的合法性、健康度和敏感程度有更高要求。此時可以使用敏感詞識別接口,實時識別出文本中是否含有廣告、色情、暴力或政治等敏感信息,同時返回顯示相關的敏感詞,有效實現對網絡文本信息合法合規性的全方位保駕護航,並為信息信息的質量提供保障。

在敏感信息過濾、輿情監控、熱門話題監督、UGC文本數據審核、遊戲社區敏感信息審核等場景中,敏感詞識別接口有着廣泛的使用需求。

03

用戶指令解析

智能客服為用戶服務的前提是理解用戶的指令,這時,可以使用詞法分析接口,包含智能分詞(基本詞和短語)、詞性標註、命名實體識別三大功能,利用該接口服務對用戶所表達的文本進行預處理。具體來說,該服務以智能分詞和詞性標註為基礎,首先識別出文本中的基本詞彙(分詞),然後對這些詞彙進行重組,同時對重組後的詞彙進行詞性標註,最後進一步識別出命名實體(專有名詞識別);通過分析用戶語音或文字命令中的關鍵名詞、動詞、數量詞、時間、地名等,準確理解用戶指令的含義,極大提升用戶體驗和用戶對智能客服的滿意度。

04

新聞資訊個性化推薦

當前的資訊聚合時代,用戶閱讀新聞的習慣已經從網頁端逐漸轉向了手機App,而且越來越青睞新聞資訊類App的內容個性化推薦功能。個性化推薦功能的實現離不開自然語言處理的幫助。

針對新聞資訊類App,可以使用詞法分析(智能分詞、詞性標註、命名實體識別)和文本分類接口。先對海量新聞的內容類型進行自動分類,獲得文本主題的一級分類、二級分類,並對主題詞彙進行標記;然後結合用戶畫像,將不同的資訊內容推薦給關注了相應主題的用戶,最終實現千人千面、精準個性化推薦的效果,每個用戶打開App後看到的都是自己最感興趣的新聞資訊,用戶的閱讀體驗得到了大幅度提升。

05

文本智能糾錯

智能客服的工作場景里,語音轉文本的過程中,不可避免地會出現一些上下文錯位和措辭上的文本錯誤。如果單純使用人工來糾錯,會消耗大量的人力成本。這時,可以使用句法依存分析和文本糾錯接口,對文本中各個語言單位之間的語義關聯進行分析,同時實現對文本的自動糾錯,提升語音轉文字的效率和質量。

出版物或掃描件文檔的圖像轉文本(OCR)場景里,句法依存分析和文本糾錯接口也可用於圖像中的文字識別結果驗證中。

此外,辦公文檔審核、文本智能質檢等場景中,對文本糾錯和句法依存分析接口也有大量需求。

06

金融文檔結構化抽取

在銀行、保險、證券等金融領域和政務領域中,常有大量的文檔和單據需要人工進行整理、提煉和歸檔。這時,可以使用詞法分析(智能分詞、詞性標註、命名實體識別)、關鍵詞提取和文本分類接口,首先對大量的金融或政務文檔進行分類,然後再進行文本資料的關鍵信息抽取和結構化排布,可以有效地輔助人工來處理各種文檔和單據,降低人力成本。

07

網絡文本內容檢索

不同的用戶針對互聯網環境或數據庫中的文本數據存在不同的信息檢索需求。這時,可以使用詞法分析(智能分詞、詞性標註、命名實體識別)和關鍵詞提取接口,對文本的標題和內容進行核心關鍵詞分析,提取出能夠反映文本關鍵信息的主題、話題、實體等多維度詞彙標籤;然後聚合相同關鍵詞標籤的文本資料,並精準提供給用戶,便於用戶對該類型的文本資料進行全方位的信息閱讀。

點擊體驗騰訊雲AI自然語言處理產品

現階段,為感謝合作夥伴和新老客戶的信任和支持,當前產品公測免費