91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎樣使用Python創(chuàng)建詞云

ss ? 來源:磐創(chuàng)AI ? 作者:磐創(chuàng)AI ? 2020-11-06 17:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹從開始從事數(shù)據(jù)可視化工作的那一天起,我就愛上它了,我總是喜歡從數(shù)據(jù)中獲得有用的見解。在此之前,我只了解基本圖表,例如條形圖,散點圖,直方圖等,這些基本圖表內(nèi)置在tableau中,而Power BI則用于數(shù)據(jù)可視化。通過每天完成此任務(wù),我遇到了許多新圖表,例如徑向儀表盤,華夫圖等。

因此,出于好奇,最近我正在搜索數(shù)據(jù)可視化中使用的所有圖表類型,這些詞云引起了我的注意,我發(fā)現(xiàn)它非常有趣。之后,我嘗試使用Tableau和Power BI中的少量數(shù)據(jù)來制作詞云,在成功嘗試之后,我想通過使用條形圖,餅圖和其他圖表的代碼來嘗試使用它。詞云是什么?定義:詞云是一個簡單但功能強大的可視化表示對象,用于文本處理,它以更大,更粗的字母和不同的顏色顯示最常用的詞,單詞的大小越小,重要性就越小。

詞云的用途

1.社交媒體上的熱門標(biāo)簽(Instagram,Twitter):全世界的社交媒體都在尋找最新的趨勢,因此,我們可以獲取人們在其帖子中使用最多的標(biāo)簽來探索最新的趨勢。

2.媒體中的熱門話題:分析新聞報道,我們可以在頭條新聞中找到關(guān)鍵字,并提取出前n個需求較高的主題,來獲得所需的結(jié)果,即前n個熱門媒體主題。

3.電子商務(wù)中的搜索詞:在電子商務(wù)購物網(wǎng)站中,網(wǎng)站所有者可以制作被搜索次數(shù)最多的購物商品的詞云,這樣,他就可以了解在特定時期內(nèi)哪些商品需求量最大。讓我們開始使用Python來實現(xiàn)詞云首先,我們需要在jupyter notebook中安裝所有庫。在python中,我們將安裝一個內(nèi)置庫wordcloud。在Anaconda命令提示符下,輸入以下代碼:pip install wordcloud

如果你的anaconda環(huán)境支持conda,請輸入:conda install wordcloud

這可以直接在notebook中實現(xiàn),只需在代碼的開頭添加“!”即可。像這樣:!pip install wordcloud

但現(xiàn)在我想生成擁有任何主題的維基百科文本的詞云,因此,我將需要一個Wikipedia庫來訪問Wikipedia API,可以通過在anaconda命令提示符下安裝Wikipedia來完成,如下所示:pip install wikipedia

現(xiàn)在我們還需要其他一些庫,它們是numpy,matplotlib和pandas。截至目前,我們需要的庫就安裝好了import wikipedia

result= wikipedia.page("MachineLearning")

final_result = result.content

print(final_result)

機(jī)器學(xué)習(xí)維基百科頁面的輸出:

上圖是我們通過檢索Wikipedia的機(jī)器學(xué)習(xí)頁面獲得的輸出圖像,我們還可以看到它可以向下滾動,這表示將檢索整個頁面。在這里,我們還可以通過摘要方法得到頁面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)

print(result)

這里我們有句子的參數(shù),因此我們可以用它來檢索特定的行數(shù)。

輸出5個句子讓我們一起創(chuàng)建wordcloudfrom wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)

plot_cloud(wordcloud)

停用詞是沒有任何含義的單詞,例如‘is’, ‘a(chǎn)re’, ‘a(chǎn)n’, ‘I’ 等。Wordcloud帶有內(nèi)置停用詞庫,該庫將自動從文本中刪除停用詞。同時我們也可以通過stopwords.add()函數(shù)在python中添加停用詞的選擇。Wordcloud方法可以設(shè)置詞云的寬度和高度,我將它們都設(shè)置為500,背景色設(shè)置為粉紅色。如果不添加隨機(jī)狀態(tài),則每次運行代碼時,詞云都會看起來不同,我們可以將其設(shè)置為任何int值。從上面的代碼中,我們將獲得這樣的詞云:

通過查看上圖,我們可以看到機(jī)器學(xué)習(xí)是最常用的詞,還有一些其他經(jīng)常使用的詞是模型,任務(wù),訓(xùn)練和數(shù)據(jù),因此,我們可以得出結(jié)論,機(jī)器學(xué)習(xí)是訓(xùn)練數(shù)據(jù)模型的任務(wù)。我們還可以在這里通過背景顏色方法更改背景顏色,并通過colormap方法更改字體顏色,還可以在背景顏色中添加顏色的哈希碼,但是mapcolor帶有內(nèi)置的特定顏色。讓我們通過使用哈希碼將背景色更改為藍(lán)綠色,將字體顏色更改為藍(lán)色:from wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)

plot_cloud(wordcloud)

在這里,我指定了ocean,如果我添加了一些錯誤的顏色圖,jupyter將拋出一個值錯誤,并向我顯示顏色圖的可用選項,如下所示:

我們還可以使用PIL庫在任何圖像中實現(xiàn)詞云。尾注在本文中,我們討論了詞云,詞云的定義,應(yīng)用領(lǐng)域以及使用python實現(xiàn)詞云。參考鏈接:https://www.a(chǎn)nalyticsvidhya.com/blog/2020/10/word-cloud-or-tag-cloud-in-python/

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7339

    瀏覽量

    94833
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4877

    瀏覽量

    90117
  • 數(shù)據(jù)可視化

    關(guān)注

    0

    文章

    501

    瀏覽量

    11488
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    京東關(guān)鍵的應(yīng)用

    京東關(guān)鍵應(yīng)用核心是圍繞搜索匹配與流量獲取,貫穿商品上架、搜索優(yōu)化、付費推廣、精細(xì)化運營等全鏈路,以精準(zhǔn)匹配用戶需求、提升排名與轉(zhuǎn)化為目標(biāo)。以下是具體應(yīng)用與實操方法: 一、關(guān)鍵分類與篩選
    的頭像 發(fā)表于 01-20 09:05 ?555次閱讀

    京東關(guān)鍵搜索商品列表的Python實戰(zhàn)

    一、實現(xiàn)思路分析 URL 構(gòu)造 :京東搜索 URL 格式為 https://search.jd.com/Search?keyword=關(guān)鍵q=0.9", "Connection
    的頭像 發(fā)表于 01-09 10:34 ?680次閱讀

    淺談京東關(guān)鍵

    格式的字符串)。 關(guān)鍵與搜索結(jié)果的關(guān)聯(lián)性 :關(guān)鍵的精準(zhǔn)度決定爬取結(jié)果的相關(guān)性,京東搜索會對關(guān)鍵進(jìn)行分詞匹配(如 “Python 實戰(zhàn)書籍” 會拆分匹配 “
    的頭像 發(fā)表于 01-04 10:40 ?792次閱讀

    京東關(guān)鍵搜索商品列表的Python爬蟲實戰(zhàn)

    京東關(guān)鍵搜索商品列表 Python 爬蟲實戰(zhàn) 你想要實現(xiàn)京東關(guān)鍵搜索商品的爬蟲,我會從 合規(guī)聲明、環(huán)境準(zhǔn)備、頁面分析、代碼實現(xiàn)、反爬優(yōu)化 五個方面展開,幫助你完成實戰(zhàn)項目。 一、前置聲明(重要
    的頭像 發(fā)表于 01-04 10:16 ?814次閱讀

    知聲入選國家知識產(chǎn)權(quán)示范企業(yè)創(chuàng)建推薦單位

    近日,上海市知識產(chǎn)權(quán)局公示了《2025-2027年知識產(chǎn)權(quán)強國建設(shè)示范創(chuàng)建工作推薦結(jié)果》。知聲(上海)智能科技有限公司憑借其卓越的自主創(chuàng)新能力與知識產(chǎn)權(quán),成功入選“國家知識產(chǎn)權(quán)示范企業(yè)創(chuàng)建推薦單位
    的頭像 發(fā)表于 11-04 10:28 ?657次閱讀

    Pico Technology發(fā)布Python軟件包pyPicoSDK

    現(xiàn)有 PicoSDK 的基礎(chǔ)上構(gòu)建,使工程師、開發(fā)人員和業(yè)余愛好者能夠創(chuàng)建 Python 腳本,更加快速方便地控制其 PicoScope 設(shè)備。
    的頭像 發(fā)表于 09-29 15:03 ?967次閱讀

    termux調(diào)試python猜數(shù)字游戲

    用termux做一個猜數(shù)字游戲 下面是在Termux中創(chuàng)建猜數(shù)字游戲的步驟及完整實現(xiàn)方案,結(jié)合Python實現(xiàn)(最適配Termux環(huán)境): ? 一、環(huán)境準(zhǔn)備(Termux基礎(chǔ)配置) 1.
    發(fā)表于 08-29 17:15

    termux如何搭建python游戲

    戲開發(fā)流程 以Pygame為例,創(chuàng)建一個基礎(chǔ)窗口: ```python import pygame pygame.init() screen = pygame.display.set_mode
    發(fā)表于 08-29 07:06

    零基礎(chǔ)在智能硬件上克隆原神可莉?qū)崿F(xiàn)桌面陪伴(提供人設(shè)提示、知識庫、固件下載)

    個步驟:1、創(chuàng)建智能體:配置可莉的基礎(chǔ)信息2、聲音復(fù)刻:克隆可莉的聲音3、配置知識庫:配置可莉和嘟嘟可的背景、故事經(jīng)歷、語錄等知識庫 4、自定義喚醒:修改喚醒和喚醒回復(fù)語 (篇尾提供修改了喚醒
    發(fā)表于 08-22 19:51

    中國信通院發(fā)布“2025計算十大關(guān)鍵

    日前,中國信通院正式發(fā)布“2025計算十大關(guān)鍵”,中國信通院計算與大數(shù)據(jù)研究所所長何寶宏對“2025計算十大關(guān)鍵”進(jìn)行了解讀。十大
    的頭像 發(fā)表于 07-30 10:53 ?3204次閱讀
    中國信通院發(fā)布“2025<b class='flag-5'>云</b>計算十大關(guān)鍵<b class='flag-5'>詞</b>”

    HarmonyOS5服務(wù)技術(shù)分享--函數(shù)預(yù)加載文章整理

    ??嗨,親愛的開發(fā)者朋友們!??? 今天咱們來聊聊如何使用??端一體化方式開發(fā)函數(shù)??,尤其針對華為的預(yù)加載服務(wù)。整個過程會手把手帶你從零開始,涵蓋創(chuàng)建工程、編寫代碼、調(diào)試到部署,幫你輕松掌握
    發(fā)表于 05-22 20:33

    HarmonyOS5服務(wù)技術(shù)分享--Serverless抽獎模板部署

    活動。不用寫復(fù)雜代碼,跟著步驟走就能搞定,文末還有部署避坑指南哦~ 一、前期準(zhǔn)備 1?? ??注冊賬號+創(chuàng)建項目?? 先到華為開發(fā)者平臺注冊賬號 創(chuàng)建新項目時記得勾選\"開發(fā)
    發(fā)表于 05-22 20:25

    HarmonyOS5服務(wù)技術(shù)分享--ArkTS開發(fā)Node環(huán)境

    Studio 3.0+,配置HarmonyOS SDK。 ??服務(wù)開通??:在AGC(AppGallery Connect)控制臺創(chuàng)建項目,開通函數(shù)服務(wù),獲取agconnect-services.json
    發(fā)表于 05-22 17:21

    HarmonyOS5服務(wù)技術(shù)分享--函數(shù)創(chuàng)建配置指南

    。HarmonyOS的AGC平臺提供靈活配置,支持Node.js、Python、Java等多種語言,還能自定義運行環(huán)境哦! ?? 二、手把手創(chuàng)建第一個函數(shù) ??Step 1:進(jìn)入
    發(fā)表于 05-22 17:08

    python入門圣經(jīng)-高清電子書(建議下載)

    此資料內(nèi)容是一本針對所有層次的Python 讀者而作的Python 入門電子書。 全書分兩部分:第一部分介紹用Python 編程所必須了解的基本概念,包括matplotlib、NumPy
    發(fā)表于 04-10 16:53