91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

IBM開發(fā)了一個名為“人臉多樣性”的新項目,并為其準備了上百萬張圖片

電子工程師 ? 來源:lq ? 2019-04-24 17:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

斯特于2013年拍攝的這張照片被收錄在IBM的人像數(shù)據(jù)集(Diversity in Faces)中

毫無疑問,這張家庭照片是非常可愛的:照片中的爸爸留著短須,戴著無框眼鏡,棕色頭發(fā)的媽媽咧著嘴笑著。他們正和兩個蹣跚學步的女兒一起嬉戲,同時品嘗著冰淇淋。

但是,這張照片于2013年被上傳到照片分享網(wǎng)站Flickr上時,“可愛”以外的屬性引發(fā)了爭議。對于面部識別系統(tǒng)來說,這張照片有著獨特的意義。照片里,人臉出現(xiàn)在了畫面的不同位置。這樣的照片能夠幫助訓練人工智能來識別照片和視頻中的人臉。

IBM開發(fā)了一個名為“人臉多樣性”的新項目,并為其準備了上百萬張圖片,這張其樂融融的照片就是其中之一,該項目旨在提升人臉識別的公平性和準確性。

照片的拍攝者是佛蒙特州農(nóng)村的一名圖書管理員,名叫杰薩姆·韋斯特Jessamyn West。當她發(fā)現(xiàn)這張照片被IBM使用了的時候,她感到既驚訝又憤怒,她曾將這張照片上傳到Flickr,并添加了知識共享(Creative Commons)協(xié)議,以便讓其他人可以使用這張照片。

但是她不知道的是,包括她拍攝的自畫像在內(nèi)的十幾張照片,和這張照片一樣都包含在了人臉識別數(shù)據(jù)集中,這讓她感到十分不安。她說:“如果當初有人(就使用我的照片)征求過我的同意,我不會如此不安和憤怒。”

多年來,研究人員們通過互聯(lián)網(wǎng)收集并注釋了各類物體的照片,以此來訓練電腦,讓其可以更好地了解它們周圍的世界。通常,他們通過谷歌圖片搜索、公共Instagram帳戶和一些其他的途徑(有些合法,有些可能不合法)獲取數(shù)量巨大的圖片。得到的數(shù)據(jù)集通常被用于學術研究,比如訓練或測試人臉識別算法。但隨著微軟、亞馬遜、臉書和谷歌等公司押寶人工智能,人臉識別正走出實驗室,進入大型企業(yè)的視野中。

隨著消費者意識到他們在互聯(lián)網(wǎng)上留下的數(shù)據(jù)能夠產(chǎn)生的巨大威力,人臉識別數(shù)據(jù)集正在加劇人們對隱私和監(jiān)控的擔心。因此,一些研究人員正在重新審視這種野蠻收集他人照片的行徑。在充滿分享精神的互聯(lián)網(wǎng)中,使用他人照片本應征求別人同意。

01

照片從哪里來?

由于深度學習的普及,近年來機器學習研究蒸蒸日上,人臉識別技術也得到了極大的改善。在一個典型的用例中,照片、視頻或實時流媒體中的人臉會被掃描、分析,接著,它們的特征會被拿來與數(shù)據(jù)庫中注釋過的人臉進行比較。

這項技術正被用于打擊人口販運和機場快速安檢,同時它也被用于監(jiān)視音樂會、體育賽事。

然而,面部識別的準確性仍是一個問題。研究人員開始擔心人工智能系統(tǒng)中存在的歧視和偏見。該技術在正確識別有色人種和女性等方面還存在著重大缺陷。造成這一問題的原因之一,是數(shù)據(jù)集里男性相對于女性、白人相對有色人種的懸殊比例。

對機器訓練來說,數(shù)據(jù)多樣性很重要,但數(shù)據(jù)的體量大小也同樣重要。人臉識別系統(tǒng)的訓練和測試需要在數(shù)千萬甚至數(shù)百萬張人臉上進行。

多年來,研究人員一直通過IBM的人臉識別數(shù)據(jù)集來進行相關研究。這個包含圖片鏈接的數(shù)據(jù)集都是從Flickr和雅虎發(fā)布一百萬張圖片的資源包中整理生成。該資源包被稱為YFCC100M,它被用于各種各樣的科學項目研究,包括在不使用地理坐標的情況下估算照片和視頻的拍攝地點的研究。

許多公司、研究機構和個人都為面部識別編制了數(shù)據(jù)集,IBM只是其中之一。其中一些數(shù)據(jù)集由實際的圖像組成,還有一些類似IBM的數(shù)據(jù)集,是由圖像鏈接組成的。有時,數(shù)據(jù)集也是可以通過拍攝模特得到的。

這些人像屬于英偉達用于訓練GAN系統(tǒng)的數(shù)據(jù)集

通常情況下,這些數(shù)據(jù)集是知識共享的,但它們必須用于非商業(yè)目的,比如算法研究。但CNN發(fā)現(xiàn),大量的類似數(shù)據(jù)集可以從Github等網(wǎng)站免費下載。

David A. Shamma在雅虎實驗室擔任研究主管時,幫助整理了Flickr的數(shù)據(jù)集。他認為,近些年來學術界為了機器視覺和識別研究,正從他們能接觸到的任何地方,想方設法地搜集數(shù)據(jù),“在這個一個學術領域里,人們經(jīng)常說,‘沒有造成傷害,就不算犯規(guī)’”。

Shamma認為,他和他的同事發(fā)布的Flickr大數(shù)據(jù)集,通過將大量授權的圖片交給研究人員,可以幫助學術界以此為基礎進行研究。

這些被上傳到Flickr上的圖片來源于像韋斯特這樣的普通人和一些專業(yè)人士。這些圖片擁有的知識共享協(xié)議是一種特殊類型的版權許可,?它明確規(guī)定了圖像可以在何種條件下被他人使用和共享。

知識共享協(xié)議于2002年首次發(fā)布,遠遠早于當前的人工智能熱潮。

盡管研究人員在Flickr等網(wǎng)站上免費使用圖片,但他們也承認,許多上傳這些照片的人可能會對照片被用于訓練人工智能的事實感到驚訝。

Shamma說:“我認為人們對自己的照片用途有一定的預計,但是當被告知具體的人工智能用途時,他們?nèi)詴械揭馔狻!?/p>

02

不滿在升級

不論人工智能的從業(yè)者們?nèi)绾谓忉專f斯特在得知自己照片被用作機器學習后大吃一驚。今年3月,她在閱讀了一篇NBC新聞報道后,搜索了自己的Flickr賬戶。結果發(fā)現(xiàn)她為朋友的家人拍的照片和其他許多照片一樣,都是數(shù)據(jù)集的一部分時,她很沮喪。她認為人工智能的未來很明朗,但自己的照片在不知情的情況下被用來訓練人工智能使她憂心重重。

Twitter上相關的帖子充斥著普通網(wǎng)民的抗議。很多人也沮喪地發(fā)現(xiàn),他們在網(wǎng)上分享的照片(通常是很久以前的照片)成為了訓練人工智能的素材。

韋斯特要求IBM從數(shù)據(jù)集中刪除她的照片,但這只能通過發(fā)郵件來完成。她還必須授權IBM使用她的社交賬號,以便其能夠找到并刪除每一張照片。

IBM表示,它“致力于保護隱私權”,數(shù)據(jù)集中涉及到的人隨時都可以選擇退出。不過,它并沒有提供工具來幫助確認數(shù)據(jù)集是否包含了特定的圖像,因此人們必須通過NBC構建的搜尋工具來查找。

與此同時,芯片制造商英偉達的研究人員正在研究IBM的經(jīng)驗教訓,并考慮改變自己的做法。

今年3月,英偉達發(fā)布一個在線工具,幫助人們了解他們的照片是否被包含在用于訓練StyleGAN的數(shù)據(jù)集里。StyleGAN是今年2月英偉達公布的一個人工智能系統(tǒng),善于創(chuàng)造實際上并不存在的逼真人臉,它的數(shù)據(jù)集包含70,000張高質量的Flickr授權圖片。

在NBC揭露了私人圖片被用作機器訓練后,英偉達的在線工具才出現(xiàn)在網(wǎng)絡上。然而英偉達負責圖形研究的副總裁David Luebke辯稱,這項工具已經(jīng)開發(fā)了一段時間了。

他說:“當人們慢慢意識到這一點的同時,我們也一直在為之努力。只要有人(對搜集自己的圖片)提出反對,我們也希望能贏得他們尊重?!?/p>

如果用戶想從數(shù)據(jù)集中刪除自己的照片,或避免其用于未來的計算機視覺研究,該公司還列出了一系列預防措施對用戶進行指導。

這些建議包括將照片設為私有、更改其附帶的使用許可,以及在照片上添加一個標簽,以表明他們不希望將其用于計算機視覺研究。

Luebke說:“我認為很多人要么不在乎,要么會很樂意他們的照片被用在StyleGAN這樣的研究上。但如果有人不喜歡這樣,那也有辦法退出?!?/p>

這張韋斯特的自拍照和其他的照片一起被編入IBM的數(shù)據(jù)集中

一些研究人員認為,人們應該通過授權,自己決定圖片是否可以用于計算機視覺或人工智能研究。

對此,知識共享協(xié)議并不能幫上大忙。只要遵循相關的條款,這個來自非營利組織的許可協(xié)議并不限制任何形式的人工智能開發(fā)。

知識共享組織首席執(zhí)行官Ryan Merkley稱:“這些協(xié)議并不是為了保護隱私或研究倫理而設計的。”

03

等待立法

近年來,人工智能發(fā)展之快,以至于相關法規(guī)幾乎還沒有來得及制定,更不用說實施了。法律上,在收集和使用圖像進行面部識別時,公司并沒有告知義務。

目前還沒有相關的聯(lián)邦法規(guī)出臺。在各州,情況則有所不同:例如,伊利諾斯州有一項法律,要求公司在收集生物特征信息之前必須得到客戶的同意;亞馬遜和微軟總部所在地華盛頓州的州參議院最近通過了一項限制面部識別使用的法案,該法案仍需在該州眾議院獲得通過。

Merkley和其他人認為應該考慮立法來規(guī)范數(shù)據(jù)收集。今年3月,參議院提出了一項法案,要求企業(yè)在收集和共享識別數(shù)據(jù)之前必須征得消費者的同意。它還要求公司進行外部測試,以確保算法在實施前是公平的。

數(shù)字版權組織電子前沿基金會(Electronic Frontier Foundation)技術政策主管Jeremy Gillula則表示,即使沒有嚴格的法律限制私人照片用于人工智能訓練,企業(yè)和研究團體也應該注意遵守道德規(guī)范。

在他看來,這意味著使用照片就要得到照片中人物的明確同意。即便這很難做到,它也是企業(yè)必須面對的現(xiàn)實。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1819

    文章

    50177

    瀏覽量

    266191
  • 人臉識別
    +關注

    關注

    77

    文章

    4127

    瀏覽量

    88614
  • 數(shù)據(jù)集

    關注

    4

    文章

    1238

    瀏覽量

    26238

原文標題:你社交網(wǎng)站上的照片,也許已經(jīng)被用來訓練人工智能了

文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    能輸出表格、代碼、圖紙、圖片的AI客服系統(tǒng)

    在工業(yè)4.0與智能制造的浪潮下,傳感器及控制系統(tǒng)技術復雜與場景多樣性對服務支持提出了前所未有的挑戰(zhàn)。 傳統(tǒng)客服模式因技術文檔解讀門檻高、協(xié)作效率低等問題,難以滿足行業(yè)對精準與實時
    的頭像 發(fā)表于 03-11 19:13 ?889次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>個</b>能輸出表格、代碼、圖紙、<b class='flag-5'>圖片</b>的AI客服系統(tǒng)

    【上海晶珩睿莓 1 單板計算機】人臉識別

    、關鍵代碼、板端推理、效果演示等流程。 項目介紹 準備工作:硬件連接、OpenCV 安裝、所需軟件包和庫安裝等; 人臉識別:模型獲取、訓練圖片、流程圖、代碼、
    發(fā)表于 01-04 20:22

    曦智科技亮相2025多樣性算力產(chǎn)業(yè)發(fā)展大會

    11月18日,以“融合多元算力 煥新AI未來”為主題的多樣性算力產(chǎn)業(yè)發(fā)展大會2025在北京成功舉辦。曦智科技聯(lián)合創(chuàng)始人兼CTO孟懷宇博士受邀出席,并作為核心參編單位代表參與《智能計算集群卡間互聯(lián)協(xié)議》國家標準啟動儀式。
    的頭像 發(fā)表于 11-21 09:52 ?549次閱讀

    奇異摩爾受邀出席2025多樣性算力產(chǎn)業(yè)發(fā)展大會

    為探究多樣性算力發(fā)展新模式、推動國內(nèi)算力產(chǎn)業(yè)優(yōu)化升級,中國通信標準化協(xié)會多樣性算力產(chǎn)業(yè)及標準推進委員會(CCSA TC622)將于2025年11月18日在北京香格里拉飯店舉辦“多樣性算力產(chǎn)業(yè)發(fā)展大會2025”,屆時多位頂尖專家將
    的頭像 發(fā)表于 11-19 17:45 ?1475次閱讀
    奇異摩爾受邀出席2025<b class='flag-5'>多樣性</b>算力產(chǎn)業(yè)發(fā)展大會

    基于級聯(lián)分類器的人臉檢測基本原理

    基于統(tǒng)計的方法。從高層的輸入輸出角度來描述,軟件輸入是一張圖像(可以表示為uint8_t或者uint16_t的數(shù)組),輸出是檢測的結果,如果檢測到人臉會輸出
    發(fā)表于 10-30 06:14

    軟通動力中標雙胞胎集團AIGC創(chuàng)新項目

    近日,憑借軟通咨詢在AI領域卓越的咨詢實施能力和良好口碑,軟通動力成功中標雙胞胎集團四項AIGC創(chuàng)新項目,開啟雙方在數(shù)智化領域的深度合作。
    的頭像 發(fā)表于 09-19 14:34 ?845次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    1. 項目概述 本項目旨在開發(fā)并部署高精度的深度學習模型,用于自動鑒別一張
    發(fā)表于 08-21 13:59

    【Milk-V Duo S 開發(fā)板免費體驗】人臉檢測

    【Milk-V Duo S 開發(fā)板免費體驗】人臉檢測 本文介紹 Milk-V Duo S 開發(fā)板結合 OV5647 攝像頭模塊,實現(xiàn)人臉
    發(fā)表于 07-27 16:53

    【EASY EAI Orin Nano開發(fā)板試用體驗】EASY-EAI-Toolkit人臉識別

    本篇使用算法組件實現(xiàn)人臉檢測。 .準備工作 1.首先使用到EASY-EAI-Toolkit組件,ubuntu掛載目錄下克隆git clone https://github.com/EASY-EAI
    發(fā)表于 07-20 14:40

    【Milk-V Duo S 開發(fā)板免費體驗】SDK編譯、人臉檢測、OpenCV測試

    Cvitek 所提供的 TDL(Turnkey Deep Learning)集成算法,用以縮短應用程序開發(fā)所需的時間。 此架構實現(xiàn) TDL 所需算法包含前后處理 提供統(tǒng)且便捷的
    發(fā)表于 07-11 13:48

    ??低暱萍贾κ刈o生物多樣性之美

    近日,由中國林業(yè)產(chǎn)業(yè)聯(lián)合會指定的團體標準T/LYCY 3075-2024《生物多樣性監(jiān)測信息化技術規(guī)范》正式實施。作為該標準的牽頭單位,海康威視憑借在生態(tài)監(jiān)測領域的技術積累與實踐經(jīng)驗,深度參與標準編寫工作,為生物多樣性監(jiān)測信息化技術體系的構建貢獻了重要力量。
    的頭像 發(fā)表于 06-19 10:14 ?1097次閱讀

    瑞芯微模型量化文件構建

    模型是一張圖片輸入時,量化文件如上圖所示。但是我現(xiàn)在想量化deepprivacy人臉匿名模型,他的輸入是四輸入。該模型訓練時數(shù)據(jù)集只標注
    發(fā)表于 06-13 09:07

    嵌入式AI技術漫談 如何組建AI項目開發(fā)小組

    我們來談談如何組建AI項目開發(fā)小組: 為什么要為嵌入式AI項目 組建
    的頭像 發(fā)表于 06-11 16:34 ?1463次閱讀

    基于RV1126開發(fā)板實現(xiàn)人臉識別門禁系統(tǒng)解決方案

    本方案為類人臉門禁機的產(chǎn)品級解決方案,已為用戶構建帶調度框架的UI應用工程;準備好我司的easyeai-api鏈接調用;準備好UI的
    的頭像 發(fā)表于 04-18 16:23 ?1098次閱讀
    基于RV1126<b class='flag-5'>開發(fā)</b>板實現(xiàn)<b class='flag-5'>人臉</b>識別門禁系統(tǒng)解決方案

    【幸狐Omni3576邊緣計算套件試用體驗】人臉識別

    位于 rknn_RetinaFace_demo 文件目錄下 接下來就是心心念念的整活兒階段,找些有趣的圖片來測試 反饋 體驗發(fā)現(xiàn)識別效果與圖片質量密切相關,
    發(fā)表于 04-01 21:46