91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是數(shù)據(jù)標(biāo)注?數(shù)據(jù)如何標(biāo)注?

倩倩 ? 來(lái)源:今日頭條 ? 2020-07-17 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)標(biāo)注是大多數(shù)人工智能的基礎(chǔ),它決定了機(jī)器學(xué)習(xí)深度學(xué)習(xí)模型的質(zhì)量。今天的數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)的爆發(fā),比如僅在2018年,就產(chǎn)生了超過(guò)30 ZB的數(shù)據(jù)。而在在任何人工智能項(xiàng)目中,對(duì)于數(shù)據(jù)科學(xué)家而言,數(shù)據(jù)問(wèn)題都是其中的癥結(jié)所在。

什么是數(shù)據(jù)標(biāo)注?

訓(xùn)練機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,需要豐富的數(shù)據(jù),以便將其用于部署,訓(xùn)練和調(diào)整模型。訓(xùn)練機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型需要大量經(jīng)過(guò)仔細(xì)標(biāo)注的數(shù)據(jù)。標(biāo)注原始數(shù)據(jù)并準(zhǔn)備將其應(yīng)用于機(jī)器學(xué)習(xí)模型和其他AI工作流,被稱為數(shù)據(jù)標(biāo)注。根據(jù)相關(guān)統(tǒng)計(jì),數(shù)據(jù)整理在AI項(xiàng)目中消耗了80%以上的時(shí)間。

數(shù)據(jù)如何標(biāo)注?

如今,大多數(shù)數(shù)據(jù)都沒(méi)有標(biāo)注。帶標(biāo)簽的數(shù)據(jù),意味著標(biāo)注或注釋目標(biāo)模型的數(shù)據(jù),以便可以預(yù)測(cè)。通常,數(shù)據(jù)標(biāo)注包括數(shù)據(jù)標(biāo)注,注釋,審核,分類,轉(zhuǎn)錄和處理。

標(biāo)注的數(shù)據(jù)突出顯示某些特征,并根據(jù)這些特征對(duì)其進(jìn)行分類,可以通過(guò)模型分析其模式以預(yù)測(cè)新的目標(biāo)。例如,對(duì)于自動(dòng)駕駛汽車(chē)中的計(jì)算機(jī)視覺(jué),AI專業(yè)人員或數(shù)據(jù)標(biāo)注者可以使用視頻標(biāo)注工具來(lái)指示路牌的位置,并通過(guò)行人和其他車(chē)輛的位置來(lái)訓(xùn)練模型。

數(shù)據(jù)標(biāo)注中包含的一系列任務(wù):

豐富數(shù)據(jù)的工具

質(zhì)量保證

流程迭代

管理數(shù)據(jù)標(biāo)簽

培訓(xùn)新的數(shù)據(jù)標(biāo)簽

項(xiàng)目計(jì)劃

成功指標(biāo)

流程運(yùn)作

AI專業(yè)人員的數(shù)據(jù)標(biāo)簽挑戰(zhàn)?

在典型的AI項(xiàng)目中,專業(yè)人員在進(jìn)行數(shù)據(jù)標(biāo)注時(shí)會(huì)遇到以下幾個(gè)方面的挑戰(zhàn)。

數(shù)據(jù)標(biāo)簽質(zhì)量低下。數(shù)據(jù)標(biāo)簽質(zhì)量低可能有很多原因。其中最突出的原因之一是任何企業(yè)或工作流程確實(shí)三個(gè)決定因素:人員,流程和技術(shù)。

無(wú)法擴(kuò)展數(shù)據(jù)標(biāo)注操作。當(dāng)數(shù)據(jù)量不斷增長(zhǎng)并且業(yè)務(wù)或項(xiàng)目需要擴(kuò)展其容量時(shí),由于大多數(shù)企業(yè)都在內(nèi)部標(biāo)記數(shù)據(jù),因此它們通常也難以擴(kuò)展其數(shù)據(jù)標(biāo)注任務(wù)。

難以承受的成本和不存在的結(jié)果。企業(yè)和AI項(xiàng)目經(jīng)理通常雇用高薪數(shù)據(jù)科學(xué)家和AI專業(yè)人士或一組業(yè)余人員來(lái)處理數(shù)據(jù)標(biāo)簽,而企業(yè)需要承擔(dān)高昂的人工成本,當(dāng)然企業(yè)也會(huì)面臨數(shù)據(jù)標(biāo)簽不確定所帶來(lái)的問(wèn)題,所以合適的專業(yè)人員至關(guān)重要。

質(zhì)量保證。進(jìn)行質(zhì)量檢查可以為數(shù)據(jù)標(biāo)注過(guò)程提供重要價(jià)值,尤其是在機(jī)器學(xué)習(xí)模型測(cè)試和驗(yàn)證的迭代階段。

誰(shuí)來(lái)標(biāo)注數(shù)據(jù)?

相關(guān)調(diào)查顯示,2019年,企業(yè)在數(shù)據(jù)標(biāo)簽上的支出超過(guò)17億美元。到2024年,這一數(shù)字將達(dá)到41億美元。進(jìn)行數(shù)據(jù)標(biāo)注工作,除了雇傭?qū)I(yè)的數(shù)據(jù)科學(xué)家和AI專家之外,還可以考慮通過(guò)其他方式。

雇員。這包括雇用包括AI專業(yè)人員在內(nèi)的全職或兼職員工,參與AI項(xiàng)目的各個(gè)方面,其中之一是數(shù)據(jù)標(biāo)注。

托管團(tuán)隊(duì)。他們是經(jīng)驗(yàn)豐富,且訓(xùn)練有素的數(shù)據(jù)標(biāo)簽團(tuán)隊(duì)。

承包商。他們包括自由職業(yè)者和臨時(shí)工。

眾包。企業(yè)可以使用第三方平臺(tái)一次性尋找數(shù)據(jù)標(biāo)注團(tuán)隊(duì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]數(shù)據(jù)標(biāo)注對(duì)于自動(dòng)駕駛來(lái)說(shuō),就像是老師教小朋友知識(shí),數(shù)據(jù)標(biāo)注可以讓車(chē)輛學(xué)習(xí)辨別道路交通信息的能力。攝像頭、雷達(dá)、激光雷達(dá)(LiDAR)拍下來(lái)的只是一堆原始信
    的頭像 發(fā)表于 12-04 09:05 ?876次閱讀
    自動(dòng)駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>是所有信息都要<b class='flag-5'>標(biāo)注</b>嗎?

    算法工程師不愿做標(biāo)注工作,怎么辦?

    對(duì)于算法而言,圖像標(biāo)注是一項(xiàng)關(guān)鍵性工作,越是大量的新數(shù)據(jù)標(biāo)注,對(duì)于算法的性能提升越有幫助。但是圖像標(biāo)注是一項(xiàng)極其費(fèi)時(shí)費(fèi)力的工作,特別是遇到稍微復(fù)雜的場(chǎng)景時(shí),長(zhǎng)時(shí)間的重復(fù)工作,會(huì)讓
    的頭像 發(fā)表于 12-02 17:56 ?542次閱讀
    算法工程師不愿做<b class='flag-5'>標(biāo)注</b>工作,怎么辦?

    淺析多模態(tài)標(biāo)注對(duì)大模型應(yīng)用落地的重要性與標(biāo)注實(shí)例

    ”的關(guān)鍵工序——多模態(tài)標(biāo)注重要性日益凸顯。 一、什么是多模態(tài)標(biāo)注? 多模態(tài)標(biāo)注是指對(duì)文本、圖像、語(yǔ)音、視頻、點(diǎn)云等異構(gòu)數(shù)據(jù)進(jìn)行跨模態(tài)語(yǔ)義關(guān)聯(lián)的標(biāo)注
    的頭像 發(fā)表于 09-05 13:49 ?2296次閱讀

    請(qǐng)問(wèn)AICube所需的目標(biāo)檢測(cè)數(shù)據(jù)標(biāo)注可以使用什么工具?

    請(qǐng)問(wèn)AICube所需的目標(biāo)檢測(cè)數(shù)據(jù)標(biāo)注可以使用什么工具? 我使用labelimg進(jìn)行標(biāo)注,標(biāo)注后的數(shù)據(jù)集改好文件名后導(dǎo)入不進(jìn)去。一直卡在
    發(fā)表于 08-11 08:07

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的研發(fā)過(guò)程中,數(shù)據(jù)標(biāo)注是實(shí)現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是將車(chē)輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點(diǎn)云、視頻序列等)轉(zhuǎn)化為具有語(yǔ)義信息
    的頭像 發(fā)表于 07-30 11:54 ?1348次閱讀
    自動(dòng)駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?

    什么是自動(dòng)駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的開(kāi)發(fā)過(guò)程中,數(shù)據(jù)標(biāo)注是一項(xiàng)至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車(chē)輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和數(shù)據(jù)量的劇增,有效
    的頭像 發(fā)表于 07-09 09:19 ?1378次閱讀
    什么是自動(dòng)駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?如何好做<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?

    端到端數(shù)據(jù)標(biāo)注方案在自動(dòng)駕駛領(lǐng)域的應(yīng)用優(yōu)勢(shì)

    隨著自動(dòng)駕駛技術(shù)向L3及以上級(jí)別快速發(fā)展,高質(zhì)量訓(xùn)練數(shù)據(jù)的需求呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。傳統(tǒng)的數(shù)據(jù)標(biāo)注方式面臨著效率低下、成本高昂、一致性差等痛點(diǎn)。據(jù)統(tǒng)計(jì),一輛L4級(jí)自動(dòng)駕駛汽車(chē)每天產(chǎn)生的數(shù)據(jù)
    的頭像 發(fā)表于 06-23 17:27 ?1017次閱讀

    數(shù)據(jù)標(biāo)注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時(shí)代,大模型憑借其強(qiáng)大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動(dòng)力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動(dòng)力,是模型不可或缺的“養(yǎng)料。大模型則憑借
    的頭像 發(fā)表于 06-04 17:15 ?1992次閱讀
    <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>與大模型的雙向賦能:效率與性能的躍升

    AI時(shí)代 圖像標(biāo)注不要沒(méi)苦硬吃

    識(shí)別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對(duì)同類型數(shù)據(jù)集進(jìn)行一步步手動(dòng)拉框,這個(gè)過(guò)程的痛苦只有做過(guò)的人才知道。越多素材的數(shù)據(jù)集對(duì)于算法的提升越有幫助,常規(guī)情況下,一個(gè)20秒時(shí)長(zhǎng)30幀
    的頭像 發(fā)表于 05-20 17:54 ?555次閱讀
    AI時(shí)代   圖像<b class='flag-5'>標(biāo)注</b>不要沒(méi)苦硬吃

    東軟集團(tuán)入選國(guó)家數(shù)據(jù)數(shù)據(jù)標(biāo)注優(yōu)秀案例

    近日,東軟飛標(biāo)醫(yī)學(xué)影像標(biāo)注平臺(tái)在國(guó)家數(shù)據(jù)局發(fā)布數(shù)據(jù)標(biāo)注優(yōu)秀案例集名單中排名第一(案例名稱“多模態(tài)醫(yī)學(xué)影像智能數(shù)據(jù)
    的頭像 發(fā)表于 05-09 14:37 ?1227次閱讀

    標(biāo)貝科技“4D-BEV上億點(diǎn)云標(biāo)注系統(tǒng)”入選國(guó)家數(shù)據(jù)局首批數(shù)據(jù)標(biāo)注優(yōu)秀案例

    4月29日,作為第八屆數(shù)字中國(guó)建設(shè)峰會(huì)的重要組成部分,由國(guó)家數(shù)據(jù)局主辦的高質(zhì)量數(shù)據(jù)集和數(shù)據(jù)標(biāo)注主題交流活動(dòng)在福州市數(shù)字中國(guó)會(huì)展中心舉行。會(huì)議交流活動(dòng)聚焦“推動(dòng)高質(zhì)量
    的頭像 發(fā)表于 04-30 14:38 ?734次閱讀
    標(biāo)貝科技“4D-BEV上億點(diǎn)云<b class='flag-5'>標(biāo)注</b>系統(tǒng)”入選國(guó)家<b class='flag-5'>數(shù)據(jù)</b>局首批<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>優(yōu)秀案例

    數(shù)據(jù)標(biāo)注服務(wù)—奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過(guò)程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:30 ?3312次閱讀

    標(biāo)貝數(shù)據(jù)標(biāo)注服務(wù):奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過(guò)程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:27 ?1115次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>服務(wù):奠定大模型訓(xùn)練的<b class='flag-5'>數(shù)據(jù)</b>基石

    自動(dòng)化標(biāo)注技術(shù)推動(dòng)AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)在全棧數(shù)據(jù)標(biāo)注場(chǎng)景式中搭載了大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注能力,并應(yīng)用于3D點(diǎn)云
    的頭像 發(fā)表于 03-14 16:46 ?1361次閱讀

    標(biāo)貝自動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)推動(dòng)AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)在全棧數(shù)據(jù)標(biāo)注場(chǎng)景式中搭載了大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注能力,并應(yīng)用于3D點(diǎn)云
    的頭像 發(fā)表于 03-14 16:42 ?1652次閱讀
    標(biāo)貝自動(dòng)化<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>平臺(tái)推動(dòng)AI<b class='flag-5'>數(shù)據(jù)</b>訓(xùn)練革新