轉載 | 自動駕駛數據服務市場佔有率居首,這家公司是如何做到的?
從今年上海車展中搭載光學雷達的新車「含量」可以看到,各大車企正在加速跑步入場高級別輔助駕駛時代。
「乘用車是繼商用車之後主要的准自動駕駛應用場景和陣地,其規模將遠大於商用車的落地。預計2030年,高級別輔助駕駛將成為乘用車的常規標配。」一位業內人士表示。
而在如此迅猛的普及趨勢下,大眾仍然無法免除對於智慧駕駛功能安全的擔憂。
近兩年,由輔助駕駛功能失靈而引發的接二連三的交通事故也表明,如果沒有海量的、多維度的數據做支撐,輔助駕駛車輛則會對行駛環境失去精準的三維定量感知。
如同人類失去雙眼,智慧駕駛的決策系統也會錯誤地將不可行駛的區域當成可行駛區域,最終導致事故的發生。
未被填補的市場缺口
為了建立強健的神經網路,系統需要大量多樣的訓練數據。同時,通過真實路測和模擬測試來訓練機器學習模型,並不斷改進自動駕駛技術。
過去幾年,在「人臉識別」、「自動駕駛」、「語音識別」等應用領域崛起的背後,核心依然是要求精準的標註數據。
有數據顯示,中國有10萬名全職數據標註員和100萬名兼職數據標註員,他們用人工標註為人工智慧數據訓練模型提供最重要的「燃料」。
大部分人工智慧頭部企業,每年在數據採集、標註業務上都要支付數百萬甚至是數千萬的費用。然而,數據服務並非依靠堆人就能解決問題,據了解大部分外包商交付的結果數據經多次返修,依然無法達到客戶要求的精確度。
此外,在傳統採集及處理數據的過程中,很多公司沒有智慧化數據處理工具,完全是線下逐條標註——這種方式既費時又費錢。讓任務變得更加困難的是,很多路況具有特定性,某些情況不太可能經常發生。
成績單的背後
2021年,數據堂的智慧駕駛數據服務同比去年,業務漲幅達65%。並取得了連續數年智慧駕駛數據服務市場佔有率全國第一的亮眼成績。
值得一提的是,數據堂今年也成功獲得測繪資質證書,並與上汽、長城、小鵬、NISSAN、MINIEYE等中國外知名車企、tier1企業展開了深度合作。
而對於一家專業服務於自動駕駛領域的數據服務公司來說,拿到地理資訊測繪資質證書的意義不言而喻,這意味著可以在真實的道路環境下合法採集數據,併合規地進行數據標註和處理,更好地助力智慧駕駛演算法的開發,這也是其他數據服務商難以比擬的優勢。
「如同當年導航地圖的競爭格局一樣,數據標註領域最後也會僅剩下少數頭部廠商。」一位業內人士認為。
縱觀當前中國市場,雖然大大小小的人工智慧數據服務商多達數百家,看似百花齊放,一片繁榮,但其中隱藏著諸多隱患。
據了解,市面上的有許多作坊式的數據標註小外包,其數據來源不合規、標註品質參差不齊、交付承諾無法兌現,他們很難給演算法提供保質保量的訓練數據;
在涉及到點雲追蹤、融合等複雜標註場景,並沒有類似圖片標註場景中的開源工具可用,工具和平台的缺失使得一些數據服務商無法實現對數據的大規模工業化流水線生產,他們很難給演算法在短時間提供大量優質數據;
而BAT等互聯網選手雖然有著極高的專業度、極強的資源調動能力,但它們一般都緊貼自身需求,專註供應企業內部演算法所需。
反觀數據堂這種專註人工智慧數據服務領域十年之久的公司,其戰略為側重聚焦自身擅長,專註於數據生產和項目管理,通過融合最新科技的數據平台為向客戶提供最優質的訓練數據。
在這個領域,只有做到了精細化管理、組織嚴密、品質保障的數據服務企業才能真金不怕火煉。然而,這樣的企業依然只是鱗毛鳳角。
作為中國人工智慧數據服務行業第一家上市企業,數據堂的核心業務便是為AI及大數據領域公司提供自有版權的數據產品、數據採集與標註訂製服務、標註平台部署的一體化數據解決方案。
目前,數據堂擁有5000餘名技術能力極強的專業數據標註員。同時,在這家稱得上是業內龐大集團的巨輪之下,有著更多的技術與資金支援來完成快速的自我造血,不斷地精進數據服務。
為了幫客戶快速提供高品質、低成本的數據,數據堂研發了數十個可用在影像、影片、語音及文本等類型的自動處理及預標註演算法,已成功應用在5000多個標註項目中。
「通常來講,數據標註需要大量人員做簡單重複的工作,人力成本高昂。我們在人工智慧領域摸爬滾打十多年,加上幾位核心團隊成員都來自於人工智慧企業或科研機構,演算法本身就是我們的專業。我們一直在不斷尋求自動化標註的方式方法,前期可以通過自動化預標註、中期人工質檢修正的方式來提高產能。」數據堂發言人表示。

此外,數據堂在長期的服務過程中,關注到一些企業有「數據不出門」的需求,於是將沉澱了十年的數據標註平台、自動化智慧化的工具進行了產品化,在2019年就成功推出了標註平台私有化解決案數加加Pro。
「我們可以將數加加Pro部署到客戶內部,為客戶做數據加工。通過人與機器相結合的方式,實現效率與品質的最優平衡。」數據堂發言人表示。
值得一提的是,在保障數據品質方面,除了有數加加Pro的內置智慧自檢系統加持外,數據堂還有多輪次的質檢流程,從人員、平台、流程中做到專業、高效,層層把關,不斷提高對數據品質的追求。目前已獲得ISO9001體系認證,數據品質值得信賴。
「品質是我們的生命線,除了常規的ISO9001,組織、技術、流程等以外,公司內部還設有專門獨立彙報的數據品質管理中心,確保數據品質符合客戶要求。另外,我們針對所有涉及個人的數據,全部要求有符合個保法的強授權,支援再授權。而我們所擁有的測繪資質也將保證我們在採集和標註的過程中完全符合國家的標準與要求的。針對外企,我們擁有涉外調查的資質,可保證整個業務完全合規,不留死角。」數據堂發言人表示。
另一方面,數據堂通過不斷多元化、延伸業務線的連橫模式,持續活躍於人工智慧市場,業務觸角遍及智慧駕駛、智慧家居、新零售等。相比友商,標準化數據產品配合個性化數據訂製,數據堂的服務更加全面。憑藉著十年的行業經驗,數據堂可為客戶提供具有前瞻性、品質好、場景多、多樣性等特點的數據服務。
而他們所做的所有加法都未曾僭越一條底線:始終以最高性價比的產品,滿足市場最廣泛的實際需求。
總體上,通過業務上的加法擴容,深挖行業,精耕細作,形成了堅不可摧的護城河。
如今,在全球大部分知名造車、互聯網等企業的資訊化服務中,都有數據堂的身影,它也是數據標註領域極少存在的上市公司。


「自動駕駛未來可期,數據堂將持續打磨更極致的數據服務,用更加高效靈活的方式為客戶的數據處理保駕護航。」 數據堂發言人表示。

