91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子論文>模擬數(shù)字論文>如何使用改進(jìn)后的K-Means進(jìn)行網(wǎng)絡(luò)自媒體空間數(shù)據(jù)挖掘概述

如何使用改進(jìn)后的K-Means進(jìn)行網(wǎng)絡(luò)自媒體空間數(shù)據(jù)挖掘概述

2018-12-19 | rar | 1.52 MB | 次下載 | 免費(fèi)

資料介紹

  在手機(jī)、平板電腦等電子媒介的人均持有率大于一的今天,網(wǎng)絡(luò)自媒體的傳播達(dá)到了前所未有的巔峰。本文通過基于Hadoop平臺的mahout數(shù)據(jù)挖掘框架,選用經(jīng)過Canopy算法優(yōu)化后的K-means聚類分析算法,對數(shù)據(jù)進(jìn)行聚類分析,對內(nèi)涵眾多信息的網(wǎng)絡(luò)自媒體推文進(jìn)行數(shù)據(jù)挖掘,以發(fā)現(xiàn)微博數(shù)據(jù)中蘊(yùn)含的與當(dāng)下社會和生活相關(guān)的熱點詞,后通過ArcGIS,對文本類簇進(jìn)行核密度分析,再做漁網(wǎng)柵格化分析,使離散的類簇樣本具備鄰接性,能在可視化中直觀地看到類簇主題的主要分布情況,以研究人們?nèi)粘I钪械牧?xí)慣、了解單一個人的喜好,以及對某個社會事件的評價等日常生活中隱含著關(guān)于社會和生活相關(guān)的信息。

  在互聯(lián)網(wǎng)技術(shù)快速發(fā)展的今天,網(wǎng)絡(luò)自媒體在近些年得到了爆炸式的增長,它以病毒傳播的形式快速地滲透到了各行各業(yè)中,給予了所有人展示自我和了解他人的途徑[1]。新浪微博作為國內(nèi)大型網(wǎng)絡(luò)自媒體平臺之一,它具有龐大的用戶基礎(chǔ),以及由這基數(shù)龐大的用戶群體所產(chǎn)生的與個人生活或社會現(xiàn)象等與各行各業(yè)相關(guān)的大量信息;隨著Web2.0 時代的發(fā)展成熟,微博除了基于常規(guī)數(shù)據(jù)的數(shù)據(jù)挖掘以外,還有大量的包含有經(jīng)緯度位置屬性的數(shù)據(jù);這些空間位置數(shù)據(jù)可以很好地將我們的信息挖掘結(jié)果通過各大地圖的前端API 很直觀地展示出來,讓我們能很好地發(fā)現(xiàn)各種個人生活或社會現(xiàn)象等與各行各業(yè)、個人相關(guān)的話題或者感興趣的商品等事物的空間分布規(guī)律等的空間信息,因此基于微博的數(shù)據(jù)挖掘研究是十分有價值的科研方向。

  空間數(shù)據(jù)挖掘與知識發(fā)現(xiàn)(SDMKD, Spatial Data Mining and Knowledge Discovery)是數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的分支學(xué)科,它通過對空間數(shù)據(jù)集進(jìn)行一系列的處理,最終得到空間特征規(guī)則、空間聚類規(guī)則以及空間分布規(guī)律等能夠直觀展現(xiàn)空間實體的信息。最早開始關(guān)注、了解空間數(shù)據(jù)挖掘這一領(lǐng)域的人,是李德仁院士,他曾經(jīng)在二十世紀(jì)末期召開的國際地理信息系統(tǒng)學(xué)術(shù)會議上,由他首次提出空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)理論,且研究并提出了空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的理論框架。在現(xiàn)存的空間數(shù)據(jù)庫里蘊(yùn)含著巨量的信息,其中包括山高、河寬等可以使用地理信息系統(tǒng)的查詢工具發(fā)現(xiàn)的淺層信息;但除了淺層信息以外還有很多深層次的,如空間分類規(guī)則、空間偏差等信息則難以利用地理信息系統(tǒng)的查詢方法來獲取,只能通過運(yùn)算或者挖掘等手段才能夠發(fā)現(xiàn)這些信息。

  由于云計算的迅速崛起,為我們在解決機(jī)器學(xué)習(xí)中的聚類問題時面臨的復(fù)雜、大量的迭代計算提供了出色的解決方案;其中在眾多的分布式計算框架中,開源框架Hadoop 以其穩(wěn)定的性能和廉價的成本被眾多企業(yè)和科研機(jī)構(gòu)所青睞,與傳統(tǒng)并行框架相比,它具有高效、高可用、易部署等特點;apache 組織在該平臺基礎(chǔ)上開發(fā)了一個針對機(jī)器學(xué)習(xí)算法的計算框架——mahout;本文將以使用mahout 加上Hadoop組成的平臺為基礎(chǔ):Hadoop 生態(tài)中的HDFS 為數(shù)據(jù)存儲系統(tǒng);Hadoop 生態(tài)中的MapReduce 為分布式計算框架;然后選用Canopy 算法優(yōu)化后的K-means 聚類分析算法,利用搭載在Hadoop 集群上的Mahout數(shù)據(jù)挖掘框架來實現(xiàn)并行的聚類算法操作,最后,使用可視化分析的手段,將帶有主題的類簇展示在地圖上,用這種更直觀的方式來分析這些微博數(shù)據(jù)所蘊(yùn)含的信息,以研究網(wǎng)絡(luò)輿論中隱含著關(guān)于社會和生活中相關(guān)的信息,為社會的和諧、穩(wěn)定的發(fā)展提供支持。

算法 API 數(shù)據(jù)挖掘
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1MDD品牌三極管MMBT3906數(shù)據(jù)手冊
  2. 2.33 MB  |  次下載  |  免費(fèi)
  3. 2MDD品牌三極管S9012數(shù)據(jù)手冊
  4. 2.62 MB  |  次下載  |  免費(fèi)
  5. 3聯(lián)想flex2-14D/15D說明書
  6. 4.92 MB   |  次下載  |  免費(fèi)
  7. 4收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊
  8. 2.50 MB   |  次下載  |  免費(fèi)
  9. 524Pin Type-C連接器設(shè)計報告
  10. 1.06 MB   |  次下載  |  免費(fèi)
  11. 6新一代網(wǎng)絡(luò)可視化(NPB 2.0)
  12. 3.40 MB  |  次下載  |  免費(fèi)
  13. 7MS1000TA 超聲波測量模擬前端芯片技術(shù)手冊
  14. 0.60 MB   |  次下載  |  免費(fèi)
  15. 8MS1022高精度時間測量(TDC)電路數(shù)據(jù)手冊
  16. 1.81 MB   |  次下載  |  免費(fèi)

本月

  1. 1愛華AIWA HS-J202維修手冊
  2. 3.34 MB   |  37次下載  |  免費(fèi)
  3. 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊
  4. 1.63 MB   |  23次下載  |  免費(fèi)
  5. 3NB-IoT芯片廠商的資料說明
  6. 0.31 MB   |  22次下載  |  1 積分
  7. 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
  8. 0.63 MB   |  6次下載  |  1 積分
  9. 5UWB653Pro USB口測距通信定位模塊規(guī)格書
  10. 838.47 KB  |  5次下載  |  免費(fèi)
  11. 6技嘉H110主板IT8628E_BX IO電路圖資料
  12. 2.61 MB   |  4次下載  |  1 積分
  13. 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
  14. 0.04 MB   |  4次下載  |  1 積分
  15. 8100W準(zhǔn)諧振反激式恒流電源電路圖資料
  16. 0.09 MB   |  2次下載  |  1 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費(fèi)下載
  8. 340992  |  191439次下載  |  10 積分
  9. 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
  10. 158M  |  183353次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81602次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費(fèi)下載
  14. 0.02 MB  |  73822次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分