91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

向來提倡open的谷歌,現(xiàn)在也玩兒“自閉”?

DPVg_AI_era ? 來源:lq ? 2019-01-20 08:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌AI又成了話題。Reddit網友找到了谷歌AI一個名叫Conceptual Captions的數(shù)據集,發(fā)現(xiàn)該數(shù)據集并不完善,于是乎聯(lián)系谷歌AI相關人員,卻慘遭三連拒。

向來提倡open的谷歌,現(xiàn)在也玩兒“自閉”?

昨天谷歌AI大佬Jeff Dean剛剛發(fā)表長文總結了2018年的主要研究成果,其中包括“開源軟件和數(shù)據集”:

發(fā)布開源軟件和創(chuàng)建新的公共數(shù)據集是我們?yōu)檠芯亢蛙浖こ躺鐓^(qū)做出貢獻的兩種主要方式。

然而細心的Reddit網友卻發(fā)現(xiàn),谷歌AI并沒有那么“開源”,反而還拒絕共享數(shù)據:

事情是這樣的。

這位網友發(fā)現(xiàn)了谷歌AI一個叫Conceptual Captions數(shù)據集相關的比賽,以及描述這個數(shù)據集的論文(ACL 2018):

論文地址:

http://aclweb.org/anthology/P18-1238

在GitHub中對此數(shù)據集的描述為:一種包含330萬張圖像的大規(guī)模圖像數(shù)據集,專門用于機器學習圖像字幕系統(tǒng)的訓練和評估。

GitHub地址:

https://github.com/google-research-datasets/conceptual-captions

然而,當這位網友躍躍欲試想要拿這個數(shù)據集操練一番時卻發(fā)現(xiàn)了一些問題:這個數(shù)據集全部圖像都是托管的,一些鏈接現(xiàn)在已經失效。

于是,這位網友開始試圖聯(lián)系谷歌AI相關人員。

結果,真可謂是大跌眼鏡。

慘遭三連拒,熱心研究者被潑冷水

第一拒:拒絕分享預訓練模型

這就使得基準測試和論文里的結果數(shù)字變得非常難以復現(xiàn)。畢竟,不是每個人都有1k的TPU。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/3

問:哪里可以找到基于Conceptual Captions數(shù)據集的預訓練模型(RNN-,Transformer-based)?

答:預訓練模型沒有發(fā)布。

第二拒:拒絕分享與每個圖像關聯(lián)的Alt-text

諷刺的是,這篇論文標題是“Conceptual Captions: A Cleaned, Hypernymed, Image Alt-text Dataset For Automatic Image Captioning”。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/6

問:是否會發(fā)布與每個圖像關聯(lián)的Alt-text?用于生成字幕的代碼也會公開嗎?

答:沒有發(fā)布Alt-text或代碼的計劃。

第三拒:拒絕分享圖像/鏡像鏈接

這位網友表示:雖然我同意存在法律問題,但數(shù)據集中缺少數(shù)百張圖像,其他研究人員要想比較模型變得超級困難。

地址:https://github.com/google-research-datasets/conceptual-captions/issues/1

問:您能提供從tsv文件通過url下載圖像的示例代碼嗎?Python的urllib無法下載某些url (IOError: [Errno socket error] [Errno 110] Connection timed out)。但是我可以在瀏覽器中看到這些圖像。

答:謝謝你的關注!不幸的是,由于版權/法律問題,我們無法提供通過url從tsv文件下載圖像的代碼。

谷歌AI“自閉”拒共享,引網友熱議

這位熱心網友在慘遭三連拒后表示對這樣的事情非常痛心:

一篇數(shù)據集論文對于復現(xiàn)結果非常重要,如果存在阻礙數(shù)據集共享的法律問題,那么發(fā)表私人數(shù)據集論文就好了(有些領域不公開Alt-text),但基于一個不公開預訓練模型、不完全共享的數(shù)據集舉辦挑戰(zhàn)賽,我認為這就不太酷了。

而后,其它網友們也炸鍋了。

熱心網友1:_michaelx99

Deepmind的一些論文也是這樣,僅僅根據他們發(fā)表的論文,完全不可能把結果復現(xiàn)出來。我花了一段時間才意識到Arxiv或他們網站上的一篇“論文”并不是真正的出版物,因此它的主要目標是展示公司已經開發(fā)了某種能力。這與其他人能夠證實或否認他們在科學過程中所做的事情關系不大。我并不是說大公司在網上發(fā)布的所有論文都是這樣,但正如你剛剛發(fā)現(xiàn)的,其中一些論文確實如此。

熱心網友2:duckbill_principate

據我所知,四分之一的ML論文本質上是美化的廣告。

熱心網友3:GoAwayStupidAI

可重復性是科學的標志。沒有這些數(shù)據,這個結果是不可復制的,所以科學會很糟糕。

熱心網友4:Silver5005

這是ML論文最大的問題。我一直在嘗試實現(xiàn)一個股票預測的LSTM,你可以找到數(shù)百篇論文都在做同樣的概念。但它們都沒有數(shù)據集,也不會談論它們如何清理或標準化它們的數(shù)據。

熱心網友5:duckbill_principate

人們不分享他們的模型、代碼或數(shù)據集,這本身并不困擾我。令我困擾的是,這種情況發(fā)生了,而這些論文仍然被接受。這是同行評審過程的絕對失敗,它的責任完全落在審查員(和我們)的肩上。這些論文是在信任的基礎上被接受的,在某些情況下甚至是權威(我們都知道,盡管存在著雙盲的本質,但不難推斷出某些論文可能來自哪個群體),這是絕對不可接受的。

這更接近于廣告而不是科學。

熱心網友6:epic

我不知道為什么有這么多谷歌的辯護者。這對科學和機器學習都不利。是的,我們都明白為什么,但這仍然很糟糕。特別是像這樣的論文,如果不能從數(shù)據中分離出來的話,再現(xiàn)性是非常困難的。有機會的組織和個人應該以一個好榜樣來領導這個領域,而不是反過來。

對此,你怎么看?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6255

    瀏覽量

    111685
  • AI
    AI
    +關注

    關注

    91

    文章

    40403

    瀏覽量

    301985
  • 數(shù)據集
    +關注

    關注

    4

    文章

    1238

    瀏覽量

    26238

原文標題:谷歌AI遭猛懟!發(fā)布數(shù)據集論文和挑戰(zhàn)賽,卻拒絕公開數(shù)據集

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大華云面向OpenClaw生態(tài)發(fā)布Dahua Cloud Open Skills

    近日,大華云開發(fā)者平臺面向OpenClaw生態(tài)正式發(fā)布Dahua Cloud Open Skills(大華云開放技能),——一套專為OpenClaw生態(tài)打造的一站式智慧物聯(lián)技能,以“開箱即用、零代碼
    的頭像 發(fā)表于 03-26 15:20 ?221次閱讀

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協(xié)議,下一代蘋果基礎模型(Apple Foundation Models)將基于谷歌的Gemini模型和云技術。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長期以來,蘋果在AI領域的發(fā)展相對滯后,其語音助手Siri的功能平平,重大升級多次延期,引發(fā)了用戶的不滿。
    的頭像 發(fā)表于 01-13 14:59 ?5694次閱讀

    ElfBoard嵌入式教育科普|Linux系統(tǒng)I/O接口:Open函數(shù)詳解

    1.函數(shù)概述open()是Linux/Unix內核提供的底層系統(tǒng)調用,核心功能是打開或創(chuàng)建文件。成功調用后,內核會返回一個整型的文件描述符作為該文件的句柄,后續(xù)的所有讀寫操作都基于此描述符進行。調用
    的頭像 發(fā)表于 12-29 11:41 ?1129次閱讀
    ElfBoard嵌入式教育科普|Linux系統(tǒng)I/O接口:<b class='flag-5'>Open</b>函數(shù)詳解

    泰凌微:布局端側AI,產品支持谷歌LiteRT、TVM開源模型

    ?電子發(fā)燒友網報道(文/李彎彎)泰凌微近日表示,公司與谷歌在智能家居、音頻等多個領域開展具體項目合作。其與谷歌已從單一的遙控器芯片供應,發(fā)展為涵蓋音頻、智能家居、端側AI等多領域的深度合作關系
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    魔法打敗魔法!疆鴻智能PROFIBUS光纖模塊化,讓電磁干擾直接“自閉

    魔法打敗魔法!疆鴻智能PROFIBUS光纖模塊化,讓電磁干擾直接“自閉” 1. 項目背景 國內某大型汽車制造廠焊裝車間內,數(shù)十臺焊接機器人協(xié)同作業(yè),構成高節(jié)拍自動化產線??刂葡到y(tǒng)采用西門子
    的頭像 發(fā)表于 12-10 16:10 ?448次閱讀
    魔法打敗魔法!疆鴻智能PROFIBUS光纖模塊化,讓電磁干擾直接“<b class='flag-5'>自閉</b>”

    鴻蒙系統(tǒng)對手機市場會產生怎樣的影響?現(xiàn)在汽車是不是用上鴻蒙系統(tǒng)了?

    鴻蒙系統(tǒng)對手機市場會產生怎樣的影響?現(xiàn)在汽車是不是用上鴻蒙系統(tǒng)了?
    發(fā)表于 12-04 20:47

    為什么在LabVIEW中使用VISA Open連接示波器時報錯-1073807346,但使用NIMAX依舊可以正常連接?

    首先,我簡單描述一下我遇到的情況。 我通過VISA Open.vi嘗試創(chuàng)建一個項目與示波器的LAN連接,有概率出現(xiàn)VISA Open.vi報錯-1073807346:所給會話或對象引用無效。但通過
    發(fā)表于 09-05 10:49

    谷歌查找我的設備配件(Google Find My Device Accessory)詳解和應用

    谷歌查找我的設備配件(Google Find My Device Accessory)介紹 谷歌查找我的設備配件是與谷歌 “查找我的設備” 應用程序配合使用的配件,旨在幫助用戶更方便地追蹤和定位個人
    發(fā)表于 08-31 21:10

    請問IG502網關如何配置open vpn客戶端?

    網上找的教程配置open vpn,服務端正常,小圖標已經變綠。IG502網關做客戶端的話需要怎么配置?需要注意哪里?
    發(fā)表于 08-05 07:59

    是德科技攜手合作伙伴展示先進Open RAN解決方案

    是德科技(NYSE: KEYS )日前宣布,在O-RAN聯(lián)盟2025年春季全球PlugFest活動上,與全球行業(yè)合作伙伴攜手展示了其在Open RAN領域的創(chuàng)新解決方案。
    的頭像 發(fā)表于 08-01 16:43 ?1707次閱讀

    WPP Media發(fā)布業(yè)內首個「大營銷模型」Open Intelligence

    全新數(shù)據解決方案和開創(chuàng)性「大營銷模型」,通過預測性智能提升營銷表現(xiàn),驅動業(yè)務增長 上海?2025年6月4日?/美通社/ --?今天,WPP Media正式推出 Open Intelligence
    的頭像 發(fā)表于 06-04 16:12 ?773次閱讀
    WPP Media發(fā)布業(yè)內首個「大營銷模型」<b class='flag-5'>Open</b> Intelligence

    谷歌地圖GPS定位

    谷歌地圖GPS定位:精準導航背后的技術解析 谷歌地圖作為全球最受歡迎的地圖服務之一,其精準的GPS定位功能為用戶提供了極大便利。本文將深入探討谷歌地圖如何利用GPS技術,實現(xiàn)高精度定位,并帶來革命性
    的頭像 發(fā)表于 05-29 16:54 ?1562次閱讀

    有沒有提供支持opcua通訊協(xié)議的open Harmony 設備

    有沒有提供支持opcua通訊協(xié)議的open Harmony 設備
    發(fā)表于 05-24 05:11

    谷歌發(fā)布混合量子模擬方法

    據外媒報道,谷歌發(fā)布了一種混合量子模擬方法;論文已經在Nature正式發(fā)表,谷歌混合量子模擬器的核心在于將模擬和數(shù)字技術相結合;是全新的模擬-數(shù)字方案,可在保持速度的同時增強可控制性,這一方案顛覆了
    的頭像 發(fā)表于 04-22 17:17 ?891次閱讀