91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓tSNE在大型、高維數(shù)據(jù)庫上實(shí)時(shí)進(jìn)行可視化的詳細(xì)資料概述

zhKF_jqr_AI ? 來源:未知 ? 作者:易水寒 ? 2018-06-10 10:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

tSNE是目前最為流行的一種高維數(shù)據(jù)降維的算法。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)不僅越來越多,而且變得越來越復(fù)雜,數(shù)據(jù)維度的轉(zhuǎn)化也在驚人地增加。對(duì)于計(jì)算機(jī)而言,處理高位數(shù)據(jù)是沒問題的,但是人類能感知到的只有三個(gè)維度,因此很有必要將高維數(shù)據(jù)進(jìn)行可視化,tSNE就是講數(shù)據(jù)集從任意維度降到二維或三維的算法。谷歌的一名實(shí)習(xí)員工最近提出了一種方法,可以讓tSNE在大型、高維數(shù)據(jù)庫上實(shí)時(shí)進(jìn)行可視化,而且還開源了。以下是論智為大家?guī)淼木幾g。

最近幾年,t分布隨機(jī)鄰近嵌入(tSNE)算法已經(jīng)成為最常用的高維數(shù)據(jù)分析工具,它經(jīng)常能提供有深度的見解。在TensorFlow嵌入項(xiàng)目和TensorBoard中用tSNE解釋深度神經(jīng)網(wǎng)絡(luò)的輸出時(shí),其中一個(gè)強(qiáng)大的特征是,tSNE在使用時(shí)只需要稍微調(diào)整參數(shù),就能在不同規(guī)模下展現(xiàn)高維數(shù)據(jù)點(diǎn)的聚類。盡管有這個(gè)優(yōu)點(diǎn),tSNE算法計(jì)算時(shí)候的復(fù)雜程度也限制了它在很多小數(shù)據(jù)集上的應(yīng)用。雖然已經(jīng)有一些針對(duì)這個(gè)問題的解決方法(主要關(guān)注點(diǎn)在數(shù)據(jù)點(diǎn)之間相似度計(jì)算的可擴(kuò)展性上),但目前為止當(dāng)可視化大數(shù)據(jù)及使用tSNE嵌入時(shí),它們還不能提供真正的互動(dòng)體驗(yàn)。

Linear tSNE Optimization for the Web一文中,我們提出了一種解決tSNE高度依賴現(xiàn)代圖形硬件問題的方法。我們的方法比其他類似技術(shù)能更快地生成嵌入,甚至可以利用GPU在客戶端的網(wǎng)頁瀏覽器上執(zhí)行。二者的結(jié)合讓大型、高維的數(shù)據(jù)庫實(shí)時(shí)可視化成為了可能。另外,我們還在TensorFlow.js中開源了這項(xiàng)成果,希望能帶來更多貢獻(xiàn)。

用我們的方法為全部MNIST數(shù)據(jù)集進(jìn)行實(shí)時(shí)tSNE嵌入演化。該數(shù)據(jù)集包含60000張手寫數(shù)字的圖片

tSNE的目標(biāo)是聚合相似數(shù)據(jù)點(diǎn)之間的小“鄰居”,同時(shí)降低整體數(shù)據(jù)的維度使之更加便于可視化。換句話說,tSNE目標(biāo)函數(shù)計(jì)算的是在二維或三維空間中這些相似數(shù)據(jù)的“鄰居”是如何分布的,然后根據(jù)此將它們映射到聚類之中。

在之前的研究中,tSNE的目標(biāo)最小化是作為N-body模擬問題進(jìn)行的,其中點(diǎn)在嵌入空間中隨機(jī)分布,每個(gè)點(diǎn)都受到兩種不同類型的力的作用。吸引力會(huì)將點(diǎn)與其在高維空間中最相似的點(diǎn)之間的距離越拉越近,同時(shí)排斥力使得它們與嵌入中的其他鄰近點(diǎn)越來越遠(yuǎn)。

吸引力只作用于一小部分點(diǎn)(也就是有相同近鄰的點(diǎn)),而排斥力在所有成對(duì)的點(diǎn)上都有作用。由于這個(gè)原因,tSNE需要強(qiáng)大的計(jì)算力和多次的目標(biāo)函數(shù)迭代,這就限制了數(shù)據(jù)庫的尺寸。為了改善這一問題,Barnes-Hut算法就用來近似估算排斥力和目標(biāo)函數(shù)的梯度。這就可以將計(jì)算擴(kuò)展到成千上萬個(gè)數(shù)據(jù)點(diǎn),但是仍然需要15分鐘以上計(jì)算MNIST嵌入。

在我們的論文中,我們提出了解決上述問題的方法,通過利用在WebGL上生成的紋理計(jì)算目標(biāo)函數(shù)的梯度近似值。我們的技術(shù)利用一個(gè)三通道的圖案在每次最小化迭代時(shí)都繪制一個(gè)“排斥域(repulsive field)”,其中的三個(gè)組成元素作為RGB通道中的顏色和形狀。每個(gè)點(diǎn)都會(huì)得到一個(gè)排斥域,用來表示點(diǎn)上水平和豎直方向的排斥力,第三個(gè)元素用作歸一化。歸一化要保證轉(zhuǎn)換過程中的量值對(duì)應(yīng)高維空間的相似度測(cè)量方法。除此之外,圖案的分辨率也會(huì)根據(jù)不同情況調(diào)整,以保證像素的數(shù)量是不變的。

如何讓tSNE在大型、高維數(shù)據(jù)庫上實(shí)時(shí)進(jìn)行可視化的詳細(xì)資料概述

渲染三個(gè)用來計(jì)算單個(gè)點(diǎn)產(chǎn)生的排斥力。上圖顯示了藍(lán)色區(qū)域中的點(diǎn)被推到了左側(cè)和底部,而紅色區(qū)域中的點(diǎn)被推倒右側(cè)和頂部,而白色區(qū)域中的點(diǎn)不會(huì)移動(dòng)

之后每個(gè)點(diǎn)的作用都被添加到GPU中,生成與排斥域相似的圖形(如下面的動(dòng)圖所示)。這種方法比計(jì)算點(diǎn)和點(diǎn)之間的作用的方法對(duì)GPU更友好。這是因?yàn)槎鄠€(gè)點(diǎn)的排斥力可以在GPU中快速地同時(shí)計(jì)算。另外,我們?cè)贕PU中也計(jì)算了點(diǎn)之間的吸引力。

如何讓tSNE在大型、高維數(shù)據(jù)庫上實(shí)時(shí)進(jìn)行可視化的詳細(xì)資料概述

tSNE嵌入的演變動(dòng)畫(左上);用來計(jì)算梯度的標(biāo)量場(chǎng)(右上);水平變換(左下);豎直變換(右下)

我們還將嵌入更新從點(diǎn)對(duì)點(diǎn)實(shí)現(xiàn)修改為在TensorFlow.js中計(jì)算的一系列標(biāo)準(zhǔn)張量操作,這是一個(gè)JavaScript庫,用于在Web瀏覽器中執(zhí)行張量計(jì)算。我們已經(jīng)開源的方法能完全在GPU上實(shí)現(xiàn)tSNE嵌入的變換,同時(shí)計(jì)算復(fù)雜性也得以改善。

有了這種只需15分鐘就能在MNIST數(shù)據(jù)集上完成計(jì)算的方法,我們現(xiàn)在可以實(shí)時(shí)在網(wǎng)頁中進(jìn)行可視化。另外,這種可視化還能在更大的數(shù)據(jù)集上實(shí)現(xiàn)。但是我們這項(xiàng)成果的主要缺陷就是目前只能在二維嵌入上工作。然而二維可視化卻經(jīng)常比三維可視化更受歡迎,應(yīng)為三維可視化需要更多交互才能理解聚類的結(jié)果。

未來的工作

我們相信,更快、更易交互的tSNE將大大提高數(shù)據(jù)分析系統(tǒng)的發(fā)展。我們很期待將這項(xiàng)成果用于深度神經(jīng)網(wǎng)絡(luò)。除此之外,我們的實(shí)驗(yàn)表明,在使用GPU計(jì)算時(shí)的橫向思維(即用RGB圖像計(jì)算梯度)可以加速計(jì)算。在未來我們將開發(fā)更多這類的梯度計(jì)算,不僅將其應(yīng)用于降維算法上,還可以用到其他瀏覽器的N-body模擬中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5196

    瀏覽量

    135514
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98092
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    4020

    瀏覽量

    68369
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26207

原文標(biāo)題:谷歌實(shí)習(xí)生提出tSNE在大型高維數(shù)據(jù)集上實(shí)時(shí)可視化的方法(附代碼)

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    KubePi:開源Kubernetes可視化管理面板,集群管理如此簡(jiǎn)單

    人員 :能夠一個(gè)統(tǒng)一的界面上監(jiān)控和管理所有集群資源,大幅提升效率。 企業(yè)IT :實(shí)現(xiàn)對(duì)跨地域、跨云的Kubernetes集群進(jìn)行統(tǒng)一管理,提升運(yùn)效率。 二、核心功能特點(diǎn):不止于
    發(fā)表于 02-11 12:53

    昊衡科技-三場(chǎng)重構(gòu)軟件,結(jié)構(gòu)的溫度與應(yīng)變可視化

    溫度/應(yīng)變場(chǎng)可視化,為多場(chǎng)景監(jiān)測(cè)提供了全新解決方案。圓柱體加載與降溫試驗(yàn)以圓柱體為測(cè)試對(duì)象,模擬了“上部加載+中部降溫”的典型工況:軟件演示中的圓柱體,能實(shí)時(shí)
    的頭像 發(fā)表于 01-22 17:32 ?1205次閱讀
    昊衡科技-三<b class='flag-5'>維</b>場(chǎng)重構(gòu)軟件,<b class='flag-5'>讓</b>結(jié)構(gòu)的溫度與應(yīng)變<b class='flag-5'>可視化</b>

    工業(yè)物聯(lián)網(wǎng)可視化平臺(tái)是什么?有什么功能?

    工業(yè)物聯(lián)網(wǎng)可視化平臺(tái)是基于物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù),將工業(yè)生產(chǎn)中的設(shè)備、系統(tǒng)、流程等數(shù)據(jù)以圖形方式呈現(xiàn),實(shí)現(xiàn)實(shí)時(shí)監(jiān)控、智能分析與交互
    的頭像 發(fā)表于 11-17 17:49 ?1289次閱讀

    光伏電站可視化的實(shí)現(xiàn)

    ,將光伏電站的物理環(huán)境、設(shè)備狀態(tài)、發(fā)電數(shù)據(jù)等信息以圖形、動(dòng)態(tài)化形式呈現(xiàn),構(gòu)建電站虛擬鏡像,從而實(shí)現(xiàn)對(duì)光伏電站運(yùn)行狀態(tài)的實(shí)時(shí)監(jiān)控、故障預(yù)測(cè)及運(yùn)優(yōu)化。 如何實(shí)現(xiàn)光伏電站的
    的頭像 發(fā)表于 10-21 17:29 ?1173次閱讀
    光伏電站<b class='flag-5'>可視化</b>的實(shí)現(xiàn)

    如何使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化

    使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化,需結(jié)合數(shù)據(jù)捕獲、協(xié)議解碼、統(tǒng)計(jì)分析及可視化工具,將原始數(shù)據(jù)轉(zhuǎn)化為可解讀的圖表和報(bào)告。以下是
    發(fā)表于 07-16 14:16

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MongoDB數(shù)據(jù)庫文件丟失的數(shù)據(jù)恢復(fù)案例

    將MongoDB數(shù)據(jù)庫文件拷貝到其他分區(qū),數(shù)據(jù)復(fù)制完成后將MongoDB數(shù)據(jù)庫原先所在的分區(qū)進(jìn)行了格式操作。 結(jié)果發(fā)現(xiàn)拷貝過去的
    的頭像 發(fā)表于 07-01 11:13 ?647次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—MongoDB<b class='flag-5'>數(shù)據(jù)庫</b>文件丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    VirtualLab:光學(xué)系統(tǒng)的三可視化

    摘要 為了對(duì)光學(xué)系統(tǒng)的性質(zhì)有一個(gè)基本的了解,對(duì)其組件的可視化和光傳播的提示是非常有幫助的。為此,VirtualLab Fusion提供了一個(gè)工具來顯示光學(xué)系統(tǒng)的三視圖。這些工具可以進(jìn)一步用于檢查
    發(fā)表于 05-30 08:45

    如何實(shí)現(xiàn)光伏數(shù)字孿生可視化?

    光伏數(shù)字孿生可視化是通過數(shù)字手段構(gòu)建光伏電站的虛擬鏡像,實(shí)現(xiàn)物理實(shí)體與數(shù)字模型的實(shí)時(shí)映射與交互,目的是促進(jìn)光伏電站運(yùn)管理的智能、高效
    的頭像 發(fā)表于 05-29 15:27 ?712次閱讀
    如何實(shí)現(xiàn)光伏數(shù)字孿生<b class='flag-5'>可視化</b>?

    工業(yè)設(shè)備可視化管理系統(tǒng)是什么

    工業(yè)設(shè)備可視化管理系統(tǒng)是一種基于物聯(lián)網(wǎng)(IoT)、大數(shù)據(jù)、云計(jì)算、數(shù)字孿生等技術(shù),對(duì)工業(yè)設(shè)備的運(yùn)行狀態(tài)、性能參數(shù)、維護(hù)信息等進(jìn)行實(shí)時(shí)監(jiān)測(cè)、數(shù)據(jù)
    的頭像 發(fā)表于 05-27 14:56 ?1149次閱讀
    工業(yè)設(shè)備<b class='flag-5'>可視化</b>管理系統(tǒng)是什么

    光伏電站可視化這種技術(shù)的難點(diǎn)有哪些?

    通過數(shù)字孿生、三建模、數(shù)據(jù)融合等技術(shù),將光伏電站的物理環(huán)境、設(shè)備狀態(tài)、發(fā)電數(shù)據(jù)等信息以圖形、動(dòng)態(tài)的形式呈現(xiàn),這便是光伏電站
    的頭像 發(fā)表于 05-15 10:56 ?638次閱讀

    結(jié)構(gòu)可視化:利用數(shù)據(jù)編輯器剖析數(shù)據(jù)內(nèi)在架構(gòu)?

    流動(dòng)路徑,為數(shù)據(jù)驅(qū)動(dòng)的決策提供堅(jiān)實(shí)基礎(chǔ)。借助數(shù)據(jù)編輯器,企業(yè)還能更便捷地對(duì)可視化呈現(xiàn)的數(shù)據(jù)進(jìn)行編輯、調(diào)整,以滿足不同分析場(chǎng)景的需求,進(jìn)一步優(yōu)
    的頭像 發(fā)表于 05-07 18:42 ?691次閱讀

    工業(yè)設(shè)備數(shù)據(jù)集中監(jiān)控可視化管理平臺(tái)是什么

    工業(yè)設(shè)備數(shù)據(jù)集中監(jiān)控可視化管理平臺(tái)是一種用于整合、監(jiān)控和可視化工業(yè)設(shè)備數(shù)據(jù)的綜合性系統(tǒng),旨在幫助企業(yè)實(shí)現(xiàn)設(shè)備數(shù)據(jù)的集中管理、
    的頭像 發(fā)表于 05-06 11:10 ?1087次閱讀

    SEGGER emFile支持大型數(shù)據(jù)庫

    SEGGER宣布emFile對(duì)大型數(shù)據(jù)庫的支持,集成了SQLite,方便與SEGGER的BigFAT和微軟的exFAT一起使用。
    的頭像 發(fā)表于 04-23 15:51 ?796次閱讀

    可視化組態(tài)物聯(lián)網(wǎng)平臺(tái)是什么

    可視化組態(tài)物聯(lián)網(wǎng)平臺(tái)是物聯(lián)網(wǎng)技術(shù)與組態(tài)技術(shù)相結(jié)合的產(chǎn)物,是通過提供豐富的圖形組件和可視化元素,用戶能夠以直觀、便捷的方式對(duì)物聯(lián)網(wǎng)數(shù)據(jù)
    的頭像 發(fā)表于 04-21 10:40 ?909次閱讀

    VirtualLab Fusion應(yīng)用:光學(xué)系統(tǒng)的3D可視化

    摘要 為了從根本上了解光學(xué)系統(tǒng)的特性,對(duì)其組件進(jìn)行可視化并顯示光的傳播情況大有幫助。為此,VirtualLab Fusion 提供了顯示光學(xué)系統(tǒng)三可視化的工具。這些工具還可用于檢查
    發(fā)表于 04-02 08:42