91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

八大機器學(xué)習(xí)數(shù)據(jù)集

DPVg_AI_era ? 來源:lq ? 2019-01-18 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Medium上的一位用戶整理了一份機器學(xué)習(xí)大型數(shù)據(jù)集清單,包括八大數(shù)據(jù)集資源庫。總有一款適合你,快來收藏吧!

下面的ML大型數(shù)據(jù)集,總有一款適合你。

就目前來看,找到一個特定的數(shù)據(jù)集來解決各種機器學(xué)習(xí)問題,甚至進行實驗還是比較困難的。

本文作者Will Badr便列舉了八大機器學(xué)習(xí)數(shù)據(jù)集。

不僅包含用于實驗的大型數(shù)據(jù)集,還附帶對數(shù)據(jù)集的描述以及使用示例。有的還包含用于解決與該數(shù)據(jù)集相關(guān)機器學(xué)習(xí)問題的算法代碼。

話不多說,上數(shù)據(jù)集!

1、Kaggle數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.kaggle.com/datasets

這是作者最喜歡的數(shù)據(jù)集之一。

每個數(shù)據(jù)集都是一個小型社區(qū),用戶可以在其中討論數(shù)據(jù)、查找公共代碼或在內(nèi)核中創(chuàng)建自己的項目。包含各式各樣的真實數(shù)據(jù)集。

用戶還可以看到與每個數(shù)據(jù)集相關(guān)的“內(nèi)核”,許多數(shù)據(jù)科學(xué)家還提供了相關(guān)手冊來分析數(shù)據(jù)集。

2、Amazon數(shù)據(jù)集

數(shù)據(jù)集地址:

https://registry.opendata.aws/

該數(shù)據(jù)源包含多個不同領(lǐng)域的數(shù)據(jù)集,如:公共交通、生態(tài)資源、衛(wèi)星圖像等。

網(wǎng)頁中也有一個搜索框來幫助用戶尋找想要的數(shù)據(jù)集,還有所有數(shù)據(jù)集的描述和使用示例,這些數(shù)據(jù)集信息豐富且易于使用!

數(shù)據(jù)集存儲在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個高度可伸縮的對象存儲服務(wù)。

如果用戶正在使用AWS進行機器學(xué)習(xí)實驗和開發(fā),這將非常方便,由于它是AWS網(wǎng)絡(luò)的本地數(shù)據(jù),因此數(shù)據(jù)集的傳輸將非???。

3、UCI機器學(xué)習(xí)資源庫

數(shù)據(jù)集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一個來自加州大學(xué)信息與計算機科學(xué)學(xué)院的大型資源庫,包含100多個數(shù)據(jù)集。

用戶可以找到單變量和多變量時間序列數(shù)據(jù)集,分類、回歸或推薦系統(tǒng)的數(shù)據(jù)集。

有些UCI的數(shù)據(jù)集已經(jīng)是被清洗過的。

4、谷歌數(shù)據(jù)集搜索引

數(shù)據(jù)集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他們最擅長的事情,推出了另一項偉大的服務(wù)——它是一個可以按名稱搜索數(shù)據(jù)集的工具箱。

他們的目標(biāo)是統(tǒng)一成千上萬個不同的數(shù)據(jù)集存儲庫,使這些數(shù)據(jù)能夠且易被發(fā)現(xiàn)。

5、微軟數(shù)據(jù)集

數(shù)據(jù)集地址:

https://msropendata.com/

2018年7月,微軟與外部研究社區(qū)共同宣布推出“Microsoft Research Open Data”。

它在云中包含一個數(shù)據(jù)存儲庫,用于促進全球研究社區(qū)之間的協(xié)作。它提供了一系列用于已發(fā)表研究的、經(jīng)過處理的數(shù)據(jù)集。

6、Awesome Public Datasets Collection

數(shù)據(jù)集地址:

https://github.com/awesomedata/awesome-public-datasets

這是一個按“主題”組織的數(shù)據(jù)集,比如生物學(xué)、經(jīng)濟學(xué)、教育學(xué)等。

這里列出的大多數(shù)數(shù)據(jù)集都是免費的,但是在使用任何數(shù)據(jù)集之前,用戶需要檢查一下許可要求。

7、政府?dāng)?shù)據(jù)集

政府相關(guān)數(shù)據(jù)集也很容易找到的。

許多國家為了提高透明度,向公眾分享了各種數(shù)據(jù)集。以下是一些例子:

歐盟開放數(shù)據(jù)門戶:歐洲政府?dāng)?shù)據(jù)集。

數(shù)據(jù)集地址:

https://data.europa.eu/euodp/data/dataset

美國政府?dāng)?shù)據(jù):目前由于一些非政治性原因,暫時無法訪問。

數(shù)據(jù)集地址:

https://www.data.gov/

新西蘭政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://catalogue.data.govt.nz/dataset

印度政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://data.gov.in/

8、計算機視覺數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.visualdata.io/

Visual Data包含一些可以用來構(gòu)建計算機視覺(CV)模型的大型數(shù)據(jù)集。

用戶可以通過特定的CV主題查找特定的數(shù)據(jù)集,如語義分割、圖像標(biāo)題、圖像生成,甚至可以通過解決方案(自動駕駛汽車數(shù)據(jù)集)查找特定的數(shù)據(jù)集。

總結(jié)

從上述作者所觀察到數(shù)據(jù)集情況來看,似乎是涵蓋各個方向和領(lǐng)域。

這些新數(shù)據(jù)集的社區(qū)將繼續(xù)發(fā)展,使數(shù)據(jù)更容易被獲取,使眾包和計算機科學(xué)社區(qū)能夠繼續(xù)快速創(chuàng)新,為生活帶來更多創(chuàng)造性的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98082
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136979
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26202

原文標(biāo)題:【收藏】8款大型機器學(xué)習(xí)數(shù)據(jù)集頂級資源

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?344次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>特征工程:分類變量的數(shù)值化處理方法

    CITE2026公布八大關(guān)鍵詞,解構(gòu)2026電子信息行業(yè)發(fā)展新態(tài)勢

    聚焦產(chǎn)業(yè)前沿與核心趨勢,特別圍繞 “八大關(guān)鍵詞” 構(gòu)建展示框架,為業(yè)界呈現(xiàn)一場前瞻洞察、技術(shù)展示、交流合作于一體的科技盛宴。 1、 消費電子 近年來,隨著5G、人工智能、物聯(lián)網(wǎng)等技術(shù)的快速發(fā)展,智能手機、智能家居、可穿戴設(shè)備等新興產(chǎn)品需求
    的頭像 發(fā)表于 02-03 10:35 ?339次閱讀
    CITE2026公布<b class='flag-5'>八大</b>關(guān)鍵詞,解構(gòu)2026電子信息行業(yè)發(fā)展新態(tài)勢

    八大常見芯片封裝類型及應(yīng)用!

    的話,給大家盤點八大主流芯片封裝形式,看完就能分清它們的用途~01DIP雙列直插式封裝個常見芯片封裝類型作為很經(jīng)典的封裝形式,DIP的引腳從兩側(cè)對稱引出,材料有塑
    的頭像 發(fā)表于 02-02 15:01 ?640次閱讀
    <b class='flag-5'>八大</b>常見芯片封裝類型及應(yīng)用!

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)
    的頭像 發(fā)表于 01-07 15:37 ?203次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    從原理到場景:工業(yè)光電傳感器八大檢測原理

    在工業(yè)自動化的世界里,光電傳感器如同機器的“眼睛”,時刻感知環(huán)境、檢測物體,讓自動化成為可能。作為深耕光電傳感多年的傳感器專家,本期小明將帶大家深入了解工業(yè)光電傳感器的經(jīng)典八大檢測原理,揭秘它們
    的頭像 發(fā)表于 11-18 07:33 ?1326次閱讀
    從原理到場景:工業(yè)光電傳感器<b class='flag-5'>八大</b>檢測原理

    RK3576機器人核心:三屏異顯+路攝像頭,重塑機器人交互與感知

    瑞芯微RK3576 AIoT處理器處理器憑借其卓越的多屏異顯與8路攝像頭接入能力,為機器人領(lǐng)域帶來革新。米爾電子MYD-LR3576開發(fā)板實測數(shù)據(jù)顯示,在高負(fù)載下CPU占用僅34%,完美實現(xiàn)多路視覺
    發(fā)表于 10-29 16:41

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】 + 04 + 機器學(xué)習(xí)YOLO體驗

    機器學(xué)習(xí)YOLO體驗 1.在線訓(xùn)練 Sipeed矽速科技擁有自研搭建的MaixHub平臺,可以快速簡單的完成yolo訓(xùn)練。 下面我將展示訓(xùn)練拍攝標(biāo)注和訓(xùn)練的相關(guān)圖片 數(shù)據(jù)
    發(fā)表于 07-24 21:35

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2902次閱讀

    江智原創(chuàng)性老人八大關(guān)鍵時光點全覆蓋 康養(yǎng)生態(tài)軟件系統(tǒng)

    深圳市江智工業(yè)技術(shù)有限公司從2016年開始專注康養(yǎng)機器人10年來的努力,專注老人穿戴,飲食,居住,出行,作息,文旅,健康,內(nèi)心八大關(guān)鍵時光節(jié)點全覆蓋的全球原創(chuàng)性的康養(yǎng)軟件系統(tǒng)于2025年6月正式發(fā)布
    的頭像 發(fā)表于 06-29 20:54 ?1068次閱讀
    江智原創(chuàng)性老人<b class='flag-5'>八大</b>關(guān)鍵時光點全覆蓋 康養(yǎng)生態(tài)軟件系統(tǒng)

    使用AICube導(dǎo)入數(shù)據(jù)點創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數(shù)據(jù)可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報錯網(wǎng)絡(luò)錯誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細節(jié),今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    Raspberry Pi Pico 2 上實現(xiàn):實時機器學(xué)習(xí)(ML)音頻噪音抑制功能

    程序的開發(fā)方式。應(yīng)用程序開發(fā)人員現(xiàn)在可以為所需系統(tǒng)整理包含大量輸入和輸出示例的數(shù)據(jù),然后使用這些數(shù)據(jù)來訓(xùn)練ML模型。在訓(xùn)練過程中,ML模型從輸入和輸出中
    的頭像 發(fā)表于 03-25 09:46 ?1228次閱讀
    Raspberry Pi Pico 2 上實現(xiàn):實時<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>(ML)音頻噪音抑制功能

    NVIDIA推出開源物理AI數(shù)據(jù)

    標(biāo)準(zhǔn)化合成數(shù)據(jù)的初始版本預(yù)計將成為世界上最大的此類數(shù)據(jù),目前已作為開源版本提供給機器人開發(fā)人員。
    的頭像 發(fā)表于 03-24 17:52 ?1039次閱讀

    請問NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 03-10 08:20