AI 數(shù)據(jù)是推動人工智能落地發(fā)展的核心基礎,是人工智能技術應用和發(fā)展的基石。人工智能的大規(guī)模應用需要利用海量數(shù)據(jù)對模型進行訓練,可以說,沒有高質(zhì)量的數(shù)據(jù)就沒有人工智能的大規(guī)模應用??梢哉f,AI 數(shù)據(jù)基礎設施已經(jīng)成為AI 新基建的重要支撐。
國家工業(yè)信息安全發(fā)展研究中心最新發(fā)布的《2020年AI新基建發(fā)展白皮書》中指出,人工智能算法的演進升級需要高質(zhì)量數(shù)據(jù)作為支撐。經(jīng)過清洗標注、去掉噪聲數(shù)據(jù)的高質(zhì)量數(shù)據(jù)集比未經(jīng)過處理的數(shù)據(jù)集更適合人工智能算法進行訓練。質(zhì)量不斷提升的數(shù)據(jù)集已經(jīng)成為人工智能技術發(fā)展的重要推動力,高質(zhì)量AI數(shù)據(jù)正驅(qū)動人工智能算法更加智能化。
回顧過去,早期的數(shù)據(jù)標注行業(yè)曾長期處于粗放的發(fā)展模式,數(shù)據(jù)粗制、混亂、復用的情況屢見不鮮;但隨著AI與各個產(chǎn)業(yè)結合得愈加緊密,AI商業(yè)化程度進入新的高度,行業(yè)屬性較強的垂直領域加速落地,數(shù)據(jù)標注的需求正逐漸轉向個性化、場景化和準確化,數(shù)據(jù)服務供應商的技術實力、精細化管理能力、流程把控能力不斷提升,數(shù)據(jù)標注行業(yè)走向?qū)I(yè)化、精細化、定制化。
這也意味著必須有能力超群的代表站出來,重新定義數(shù)據(jù)標注行業(yè)的規(guī)則。
目前,數(shù)據(jù)標注行業(yè)的企業(yè)機構主要分為三類:第一類是AI公司內(nèi)部的標注部門,第二類是數(shù)據(jù)標注眾包平臺,第三類是以場景化、高精度數(shù)據(jù)采集和標注見長的公司。
第一種形式顧名思義,科技企業(yè)自身有數(shù)據(jù)采集標注需求,大量數(shù)據(jù)標注任務由公司內(nèi)部完成。
第二種是眾包平臺,以亞馬遜眾包平臺Mechanical Turk為代表,基本按照“需求公司——眾包平臺——多個互聯(lián)網(wǎng)用戶”的模式完成。
第三種是以云測數(shù)據(jù)為代表的,專門從事高精度、場景化數(shù)據(jù)采集和標注的第三方企業(yè)。
與其他數(shù)據(jù)標注公司不同的是,云測數(shù)據(jù)更強調(diào)高精準度的場景化的數(shù)據(jù)服務。其CTO陳冠誠認為,“通過云測數(shù)據(jù)的服務,企業(yè)可以將自己算法的識別精度推到一個新的高度,進而落地成為產(chǎn)品被用戶使用,而沉淀的用戶數(shù)據(jù)以及用戶在分享過程中逐漸產(chǎn)生的更多互聯(lián)網(wǎng)數(shù)據(jù),則會讓整個數(shù)據(jù)庫演變成大數(shù)據(jù)生態(tài)。”
實際上,這所體現(xiàn)的正是對數(shù)據(jù)質(zhì)量的把控能力和對場景深度的還原能力。
以云測數(shù)據(jù)為例,為進一步滿足場景化數(shù)據(jù)的需求,首創(chuàng)了“數(shù)據(jù)場景實驗室”進行相應的場景化數(shù)據(jù)生產(chǎn),以滿足AI行業(yè)應用場景逐漸趨于長尾和碎片化的趨勢;并從幫助客戶梳理數(shù)據(jù)需求出發(fā),通過自建數(shù)據(jù)標注基地和自研的數(shù)據(jù)標注平臺進行數(shù)據(jù)的全流程把控,在保證數(shù)據(jù)的質(zhì)量、效率和隱私安全的前提下,來幫助AI企業(yè)或部門快速構建核心數(shù)據(jù)壁壘,加速AI產(chǎn)業(yè)化落地的進程。
舍恩伯格在他的《大數(shù)據(jù)時代》中預言:“數(shù)據(jù)可以量化一切,文字變成了數(shù)據(jù),方位變成了數(shù)據(jù),溝通變成了數(shù)據(jù),直到萬物的數(shù)據(jù)化。
當下,數(shù)據(jù)價值驅(qū)動的數(shù)字經(jīng)濟正成為推動社會前進的主要模式,由各種AI等創(chuàng)新技術驅(qū)動的數(shù)字化轉型成為了新基建的核心?!靶禄ā钡臇|風促使我國人工智能、5G、工業(yè)互聯(lián)網(wǎng)等行業(yè)迎來大規(guī)模提速發(fā)展機遇期,AI數(shù)據(jù)作為新的生產(chǎn)要素聲名漸顯,以云測數(shù)據(jù)為代表的深耕數(shù)據(jù)采集、數(shù)據(jù)標注的人工智能數(shù)據(jù)服務商將進一步助力AI產(chǎn)業(yè)生態(tài)的完善。
責任編輯:lq
-
算法
+關注
關注
23文章
4789瀏覽量
98393 -
人工智能
+關注
關注
1819文章
50218瀏覽量
266509 -
數(shù)字經(jīng)濟
+關注
關注
2文章
1125瀏覽量
20335
發(fā)布評論請先 登錄
2K2000龍芯主板以科技創(chuàng)新為驅(qū)動力,賦能產(chǎn)業(yè)高質(zhì)量發(fā)展
云知聲深度參與杭州市富陽區(qū)人工智能高質(zhì)量發(fā)展大會
維視智造受邀出席AI融智推動職業(yè)教育高質(zhì)量發(fā)展論壇
四維圖新亮相2025國際前瞻人工智能安全與治理大會
研華AI智能體推動儲能產(chǎn)業(yè)高質(zhì)量發(fā)展
中科曙光入選信通院2025上半年度高質(zhì)量數(shù)字化轉型十大典型案例
標貝科技參編《人工智能高質(zhì)量數(shù)據(jù)集建設指南》
易華錄入選國家首批高質(zhì)量數(shù)據(jù)集建設先行先試工作名單
中國中車通過中國信通院可信AI人工智能數(shù)據(jù)集質(zhì)量四級評估
索尼重載設備的高質(zhì)量遠程制作方案和應用(2)
人工智能算法的演進升級需要高質(zhì)量數(shù)據(jù)作為支撐
評論