91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟刪除知名數(shù)據(jù)集 撥開數(shù)據(jù)隱私的迷霧

lviY_AI_shequ ? 來源:yxw ? 2019-06-26 17:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟在日前刪除了一個名人圖片數(shù)據(jù)集。這個本為世界上最大的公開人臉識別數(shù)據(jù)集,現(xiàn)在已經(jīng)不能通過微軟的渠道訪問。

在這次「靜默」刪除行為背后,又牽扯到了哪些問題呢?

微軟想解決的麻煩:MS Celeb 名人數(shù)據(jù)集

MS Celeb 1M 數(shù)據(jù)集,最早是微軟在 2016 年發(fā)布,其中共包含了10 萬個名人,近 1000 萬張面部圖片,而這些數(shù)據(jù)都是從網(wǎng)絡上搜集而來。

從網(wǎng)絡中 100 萬個名人中,根據(jù)受歡迎程選出 10 萬個,然后利用搜索引擎,跳出每個人的大約 100 張圖片,就得到了這個龐大的數(shù)據(jù)集。

MS Celeb 數(shù)據(jù)集中的 Jobs 圖片,

其中綠色是年輕時代的圖片,紅色是合成圖像

而這個數(shù)據(jù)集最初是用來服務比賽的。MSR IRC是世界上最高水平的圖像識別賽事之一,MS Celeb 1M 數(shù)據(jù)集最初就是這個賽事所用。

MS Celeb 1M常被用來做面部識別的訓練。但對于這些圖片均來自網(wǎng)絡,所以也曾受到了質疑。而微軟則表示,是根據(jù)「知識共享許可 C.C 協(xié)議」,來抓取和獲得這些圖像的。

根據(jù)協(xié)議,可以將照片重新用于學術研究,(照片中的人物并不一定授權許可,而是版權所有者授權。)但微軟發(fā)布數(shù)據(jù)集后,卻并不能掌管它的使用。英國「金融時報」進行了一項深入調查,結果表明數(shù)據(jù)被大量的用在了多個企業(yè)測試中。

包括 IBM,松下,阿里巴巴,Nvidia 和日立等公司,都存在使用這個數(shù)據(jù)集的情況。

而這就涉及到了數(shù)據(jù)集使用的一些規(guī)范性問題,一位研究人員還指出,這涉及到人臉識別圖像數(shù)據(jù)集的倫理,起源和個人隱私等問題。

刪除原因:負責該數(shù)據(jù)集的員工離職?

微軟已經(jīng)在線上默默地刪除了MS Celeb 1M,并沒有特別的說明。

Github 上數(shù)據(jù)集的下載頁面已經(jīng)變成了 404

在金融時報的報道中,微軟表示「該網(wǎng)站主要目的是用于學術,」而刪除它的原因是,「負責運營這個項目的員工離職了,不再與微軟合作,所以進行了刪除?!?/p>

我們都相信肯定有其他原因,可能也有數(shù)據(jù)集圖片存在的問題。雖然微軟稱數(shù)據(jù)集均來自于公眾人物的照片。但其中還包括少量非知名人物。這部分人臉照片的所有者,對微軟使用他們的名稱和圖像信息,曾提出過質疑和批評。

還有技術人員推測,微軟可能會因違反歐盟《通用數(shù)據(jù)保護條例》(GDPR)而刪除數(shù)據(jù),該法規(guī)于去年生效,旨在建立起數(shù)據(jù)安全的保護措施。

GDPR對個人信息的保護及其監(jiān)管

達到了前所未有的高度

但微軟表示,它們沒有涉及到 GDPR 的條款,數(shù)據(jù)集相關網(wǎng)站退役只是因為,「曾經(jīng)的競賽已經(jīng)結束」。

當然,此次微軟移除 MS Celeb 數(shù)據(jù)集,并不妨礙它在學術研究等途徑的正常使用。那些用于處理數(shù)據(jù)庫的工具,現(xiàn)在也可正常訪問。

常用公開數(shù)據(jù)集,也可能有隱私問題

在英國「金融時報」調查之后,還有另外兩個學術單位也刪除了相關的數(shù)據(jù)集:分別是杜克大學的Duke MTMC 監(jiān)控數(shù)據(jù)集,和斯坦福大學的Brainwash 數(shù)據(jù)集。

關于數(shù)據(jù)集和隱私問題,這不是第一次進入人們的視野。在今年 1 月底,IBM 發(fā)布了百萬級別的無偏見「人臉多樣性」數(shù)據(jù)集,就曾引發(fā)了廣泛的爭議。

雖然 IBM 強調此舉是為減少面部識別中的「偏見」問題,但數(shù)據(jù)集的來源,人物的是知情度等問題,都引發(fā)了不少質疑聲。

有媒體還報道, IBM 表示會按照被攝影者的意愿,刪除數(shù)據(jù)集里的相關照片,但都只是一面之詞,并沒有實際的行動。

今年 5 月,舊金山曾頒布法令

禁止政府機構使用人臉識別技術

對于數(shù)據(jù)集的采集和使用規(guī)則,還是一個很不太明確的區(qū)域,尤其是網(wǎng)絡便利之后,很多機構都能輕易地獲得大量圖片,用于面部識別等用途。

其實,對于數(shù)據(jù)集涉及的隱私問題,解決方案可以很簡單:關乎到用戶個人隱私信息時,應保證用戶的知情權,確保用戶是否愿意貢獻數(shù)據(jù)。

但似乎缺少的從來都不是方法,而是意識。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6741

    瀏覽量

    107893
  • 數(shù)據(jù)采集

    關注

    41

    文章

    8051

    瀏覽量

    120957
  • 人臉識別
    +關注

    關注

    77

    文章

    4127

    瀏覽量

    88510
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    開發(fā)智能體配置-隱私協(xié)議服務

    1.已有描述隱私政策和用戶隱私權利的隱私網(wǎng)址:在智能體【配置】-【隱私協(xié)議服務】頁面,隱私聲明處選擇“自定義
    發(fā)表于 02-03 15:54

    發(fā)布元服務配置隱私聲明

    元服務必須先使用AGC的隱私聲明托管服務生成自己的隱私聲明,才能在版本信息頁面選擇到。詳細內容參見配置隱私聲明(元服務)和配置用戶協(xié)議。 登錄AppGallery Connect,點擊“APP與元
    發(fā)表于 11-25 11:24

    UPS電源售價迷霧重重?讀懂這幾點,讓你的每一分錢都花在刀刃上

    導語:正在為數(shù)據(jù)中心、醫(yī)療設備或家庭辦公電腦尋找一臺可靠的UPS不間斷電源?一查價格,從幾百到數(shù)萬,是不是瞬間眼花繚亂?價格差異的背后,究竟隱藏著怎樣的秘密?今天,我們就來撥開迷霧,聊聊UPS售價
    的頭像 發(fā)表于 11-20 10:45 ?576次閱讀
    UPS電源售價<b class='flag-5'>迷霧</b>重重?讀懂這幾點,讓你的每一分錢都花在刀刃上

    SimData:基于aiSim的高保真虛擬數(shù)據(jù)生成方案

    01前言在自動駕駛感知系統(tǒng)的研發(fā)過程中,模型的性能高度依賴于大規(guī)模、高質量的感知數(shù)據(jù)。目前業(yè)界常用的數(shù)據(jù)包括KITTI、nuScenes、WaymoOpenDataset等,它們?yōu)?/div>
    的頭像 發(fā)表于 11-07 17:35 ?5376次閱讀
    SimData:基于aiSim的高保真虛擬<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>生成方案

    如何保障遠程運維過程中的數(shù)據(jù)安全和隱私?

    LZ-DZ100背面 在分布式光伏集群的遠程運維中,數(shù)據(jù)安全和隱私保護面臨多重風險,包括 傳輸過程中的竊聽 / 篡改、未授權訪問控制指令、設備固件被惡意植入、敏感數(shù)據(jù)(如站點位置、運行參數(shù))泄露 等
    的頭像 發(fā)表于 08-22 10:26 ?1008次閱讀
    如何保障遠程運維過程中的<b class='flag-5'>數(shù)據(jù)</b>安全和<b class='flag-5'>隱私</b>?

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)后一直顯示數(shù)據(jù)正在解析,為什么?

    AIcube1.4目標檢測模型導入yolotxt格式數(shù)據(jù)后一直顯示數(shù)據(jù)正在解析 數(shù)據(jù)有問題,把數(shù)據(jù)情況說的詳細點
    發(fā)表于 08-13 07:16

    AI Cube如何導入數(shù)據(jù)?

    我從在線平臺標注完并且下載了數(shù)據(jù),也按照ai cube的要求修改了文件夾名稱,但是導入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具?

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具? 我使用labelimg進行標注,標注后的數(shù)據(jù)改好文件名后導入不進去。一直卡在數(shù)據(jù)
    發(fā)表于 08-11 08:07

    大成建設(Taisei)圖像數(shù)據(jù)隱私保護與AI開發(fā)協(xié)同案例解析

    基于數(shù)字化轉型下的圖像數(shù)據(jù)隱私保護與AI開發(fā)難題,本文以Taisei公司為例,詳解客戶實際需求,匹配隱私保護和數(shù)據(jù)效用完美均衡的深度自然匿名化方案,推動其人工智能的開發(fā)。
    的頭像 發(fā)表于 07-30 10:23 ?696次閱讀
    大成建設(Taisei)圖像<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>隱私</b>保護與AI開發(fā)協(xié)同案例解析

    云訓練平臺數(shù)據(jù)過大無法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺限制了圖片數(shù)量,想要本地訓練下載數(shù)據(jù)時發(fā)現(xiàn)只會跳出網(wǎng)絡異常的錯誤,請問這有什么解決辦法?
    發(fā)表于 07-22 06:03

    使用AICube導入數(shù)據(jù)點創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數(shù)據(jù)可以完成訓練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網(wǎng)絡錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    撥開迷霧:射頻連接器選型中的常見難題及解決方案

    作為連續(xù)三年榮獲“中國連接器行業(yè)十大品牌”的德索精密工業(yè),憑借專業(yè)的技術團隊、先進的生產(chǎn)工藝和嚴格的質量管控體系,已為全球超10000家企業(yè)提供高性能、高可靠性的產(chǎn)品,助力客戶撥開選型迷霧,構建高效穩(wěn)定的射頻系統(tǒng)。
    的頭像 發(fā)表于 05-19 08:53 ?465次閱讀
    <b class='flag-5'>撥開</b><b class='flag-5'>迷霧</b>:射頻連接器選型中的常見難題及解決方案

    NVIDIA推出開源物理AI數(shù)據(jù)

    標準化合成數(shù)據(jù)的初始版本預計將成為世界上最大的此類數(shù)據(jù),目前已作為開源版本提供給機器人開發(fā)人員。
    的頭像 發(fā)表于 03-24 17:52 ?1043次閱讀