四时宝库

程序员的知识宝库

python冷门操作-13.wordcloud干货

wordcloud是优秀的词云展示第三方库-词云以词语为基本单位,更加直观和艺术地展示文本
通过词云,我们可以快速提取大段文本的重要信息.

体验一下:

#直接输出

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from imageio import imread
from collections import Counter

txt = 'word_cloud是python的一个三方库,称为词云也叫做文字云,是根据文本中的词频,\
    对内容进行可视化的汇总.安装word_cloud可以使用python自带的pip工具来进行,\
    首先确保已经安装python与pip并且pip以及更新到最新版本.word_cloud依赖于numpy与pillow,\
    当然如果只想将图像保存成图片文件,使用matplotlib库代替也可以,此处索性就将三个库都安装好.'

words = [x for x in jieba.cut(txt) if len(x) >= 2]
words = ' '.join(words)
ordcloud = WordCloud(font_path='simhei.ttf', background_color='white').generate(words)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()

#加背景图

mask = imread('python.png')
wordcloud = WordCloud(font_path='simhei.ttf', background_color='white',mask = mask).generate(words)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()

#利用词频show

frequencies = Counter(words).most_common()
frequencies=dict(frequencies)
mask = imread('python.png')
wordcloud = WordCloud(font_path='simhei.ttf', background_color='white', max_words=100, mask=mask).fit_words(
    frequencies)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()

get it.

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接