達觀財債通:用 AI 糾正財務一致性審核常見錯誤

  • 2020 年 5 月 28 日
  • AI

我想你應該有過這樣的體驗

面對一份動輒三四百頁,甚至七八百頁的債券募集說明書或招股說明書,想要核查裡面涉及的財務資訊、發行人資訊、董監高資訊等,上文下文,上頁下頁翻來翻去,眼花繚亂;
好不容易起草一份招股說明書,結果聽到了審計師動數字的噩耗,而且動的還是財務主表數字。

在項目壓力巨大的時候,每一個細小的改動都足以使腦中緊繃的弦崩斷。你可能在想,會不會有一種神器,可以一鍵抓取與審核報告中的這些資訊,讓自己把更多的精力投入到深層分析中呢?其實,你所想的不僅僅是幻想而已。你想要的,AI技術完全可以幫你做到。

達觀數據最近新推出的財債通產品專門為券商、銀行等機構提供AI智慧解決方案,專攻招股說明書、債券募集說明書、各類年報、財務報表、銀行流水的審核、抽取與解析,並從財務資訊披露、財務邏輯核查、發行資訊披露、文字合規與合理性等方面進行全方位、高準度的文檔處理,旨在準確高效地減少從業人員重複勞動,提升工作效率。

財債通產品在財務一致性審核功能中,涉及了一項重要功能:多表格及表文披露糾錯,即對報告中出現的財務數據進行上下文一致性審核。
這款功能按照報告行文順序,以「對應年份」、「金額」、「財務科目」、「報告主體」四個維度對每一個出現的數據進行定位:

如圖所示,左數第二列最後一行的9,722.34的數字,在我們四個維度的定位下,被解析成如下含義:

2017年度(對應年份)發行人(報告主體)年末未分配利潤金額(財務科目)為9,722.34萬元(金額)。

經常使用Excel處理數據的朋友們肯定或多或少都有這個潛意識,只有把資訊結構統一與歸一化,才可以進行下一步的函數操作。而AI技術也是如此,若想做審核、比對等高級又複雜的操作,通過以上方式對語言文字進行結構化處理,也是非常重要與基礎的一步。

AI技術是個化繁為簡,又化簡為繁的過程,通過這一系列的處理,報告中出現的任何錶格、文章段落中涉及的財務與非財務資訊,都被這樣拍平、切碎,並結構化處理了。

結構化處理後,我們再做同一含義數據的上下文一致性審核,就變得容易多了。目前財務一致性審核可以找出如下錯誤:

1 寫注釋時科目寫錯而導致的衝突

圖1-1
圖1-2

如圖1-2、圖1-2,圖1-1中紅框內的數字為2017年末發行人其他應付款的金額,而圖1-2的文字描述中,紅框內的數字字面意思上為發行人2017年末其他應付款的金額,但由於其標題為長期應付款,從兩個金額不一致可判斷是圖1-1科目寫錯而造成的衝突。

2 正文單位寫錯而造成的衝突

我們在閱讀募集說明書時,發現如下兩段文字:
A: 發行人較好的經營業績和穩健的財務結構是本期債券按時償付的基礎。2015-2017年,公司總資產分別為380.24萬元、454.78萬元和526.47萬元,總負債分別為144.30億元、20.96億元和21.40億元,歸屬於母公司凈利潤分別為3.89億元、3.88億元和3.93億元。
B:根據華普天健會計師事務所(特殊普通合夥)出具的會審字(2018)3186號審計報告,截止2017年12月31日,發行人資產總計526.47億元,負債合計300.76億元。所有者權益合計225.71億元,資產負債率為57.13%。
你看,段落A中高亮的數字為2017年末發行人資產總計的金額,單位為萬元;而段落B中高亮的數字同樣為2017年公司總資產的數字,單位卻是億元,從而造成衝突。

3 數字格式錯誤造成的衝突

圖2-1
圖2-2

如圖2-1,紅框內的數字為2015年度財務費用的金額,數字為203,066.82萬元,而圖2-2中雖然顯示的是2015年發行人財務費用的金額,但數字為203,066,82萬元,將原本的小書店寫成了千分位符,導致產生非正確的數字格式,進而造成衝突。

4 結語

受報告編寫者寫作習慣、第三方文件品質、報告修改次數等原因的影響,錯誤的類型也多種多樣。犯錯不可怕,有糾錯做把關,就能走得更遠。

達觀數據:如何搞定讓人頭疼的金融文檔審核?達觀數據推出財債通zhuanlan.zhihu.com圖標陳運文:達觀數據:AI驅動,3分鐘審核債券募集說明書常見5類錯誤zhuanlan.zhihu.com圖標達觀數據:達觀數據中標新華財經,賦能國家級金融資訊平台建設zhuanlan.zhihu.com圖標