用Python和WordCloud绘制词云的实现方法(内附让字体清晰的秘笈)

 更新时间:2019-01-08 22:01:16   作者:佚名   我要评论(0)

环境及模块:

Win7 64位
Python 3.6.4
WordCloud 1.5.0
Pillow 5.0.0
Jieba 0.39

目标:
绘制安徽省2018年某些科技项目的词云,直观展示热点。

环境及模块:

  • Win7 64位
  • Python 3.6.4
  • WordCloud 1.5.0
  • Pillow 5.0.0
  • Jieba 0.39

目标:

绘制安徽省2018年某些科技项目的词云,直观展示热点。

思路:

先提取项目的名称,再用Jieba分词后提取词汇;过滤掉“研发”、“系列”等无意义的词;最后用WordCloud 绘制词云。

扩展:

词云默认是矩形的,本代码采用图片作为蒙版,产生异形词云图。这里用的图片是安徽省地图。

秘笈:

用网上的常规方法绘制的词云,字体有点模糊,秘笈在最后点明。

正式开始,Show you the code:

import numpy as np
from PIL import Image
import re
import jieba
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS
import matplotlib.pyplot as plt
# http://www.cnblogs.com/hatemath/
# 打开存放项目名称的txt文件
with open('content.txt','r',encoding='utf-8') as f:
  word= (f.read())
  f.close()

# 图片模板和字体
image=np.array(Image.open('ditu.jpg')) 
font=r'C:\\Windows\\fonts\\msyh.ttf' 

# 去掉英文,保留中文 
resultword=re.sub("[A-Za-z0-9\[\`\~\!\@\#\$\^\&\*\(\)\=\|\{\}\'\:\;\'\,\[\]\.\<\>\/\?\~\。\@\#\\\&\*\%]", "",word) 
wordlist_after_jieba = jieba.cut(resultword) 
wl_space_split = " ".join(wordlist_after_jieba) 

# 设置停用词 
sw = set(STOPWORDS) 
sw.add("研发")
sw.add("系列")
sw.add("这里不多写了,根据自己情况添加")

# 关键一步
my_wordcloud = WordCloud(scale=4,font_path=font,mask=image,stopwords=sw,background_color='white',
             max_words = 100,max_font_size = 60,random_state=20).generate(wl_space_split) 

#显示生成的词云 
plt.imshow(my_wordcloud)
plt.axis("off") 
plt.show() 

#保存生成的图片
my_wordcloud.to_file('result.jpg')

其中 ditu.jpg为安徽省轮廓图片:

运行结果:

可以看到,智能设备、施工工法、系统平台、电缆、机器人等都是出现较多的词汇。

最后是秘笈揭晓时间:

为什么我这张图如此清晰?打开原图可以看到,这图的分辨率是1800*2500。你用网上的大多数代码,最后生成的图,尺寸很小,上面字迹边缘模糊。

关键在于调用WordCloud时的一个参数,回放一下代码:

# 关键一步
my_wordcloud = WordCloud(scale=4,font_path=font,mask=image,stopwords=sw,background_color='white',
max_words = 100,max_font_size = 60,random_state=20).generate(wl_space_split) 

第一个参数我写的是 scale=4,这个数值越大,产生的图片分辨率越高,字迹越清晰。你可以调到64试试,我希望你的电脑足够快 /笑哭

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

您可能感兴趣的文章:

  • 用python结合jieba和wordcloud实现词云效果

相关文章

  • 用Python和WordCloud绘制词云的实现方法(内附让字体清晰的秘笈)

    用Python和WordCloud绘制词云的实现方法(内附让字体清晰的秘笈)

    环境及模块: Win7 64位 Python 3.6.4 WordCloud 1.5.0 Pillow 5.0.0 Jieba 0.39 目标: 绘制安徽省2018年某些科技项目的词云,直观展示热点。 思
    2019-01-08
  • 易语言状态条组件使用教学

    易语言状态条组件使用教学

    状态条组件在很多软件上都能见到它的身影,也为软件添彩不少。今天,我们就来认识一下状态条组件,看看它有什么作用,能为我们做哪些事情呢?一起开始我们的学
    2019-01-08
  • Python 调用PIL库失败的解决方法

    Python 调用PIL库失败的解决方法

    今天学习Python的时候,需要安装一个第三方库,Python Imaging Library,是Python下面一个非常强大的处理图像的工具库,不过PIL目前只支持到Python2.7版本。
    2019-01-08
  • Python Numpy库安装与基本操作示例

    Python Numpy库安装与基本操作示例

    本文实例讲述了Python Numpy库安装与基本操作。分享给大家供大家参考,具体如下: 概述 NumPy(Numeric Python)扩展包提供了数组功能,以及对数据进行快速处
    2019-01-08
  • python linecache 处理固定格式文本数据的方法

    python linecache 处理固定格式文本数据的方法

    小程序大功能 对一批报文要处理要处理里面的得分,发现python linecache ,特记录如下。 #!/usr/bin/env python # -*- coding: utf-8 -*- ''''提取result结
    2019-01-08
  • 易语言语法错误(100444)解决方法

    易语言语法错误(100444)解决方法

    易语言数据类型转换语法错误(10044).通过此经验希望大家能够举一反三解决所有数据类型转换的错误 1、如图_举一个简单的例子,不能将整数型转换成文本型错误 2
    2019-01-08
  • Android动态时钟壁纸开发

    Android动态时钟壁纸开发

    本文实例为大家分享了Android动态时钟壁纸展示的具体代码,供大家参考,具体内容如下 先看效果 上图是动态壁纸钟的一个时钟。 我们先来看看 Livewallpap
    2019-01-08
  • Spring Boot集成Java DSL的实现代码

    Spring Boot集成Java DSL的实现代码

    Spring Integration Java DSL已经融合到Spring Integration Core 5.0,这是一个聪明而明显的举动,因为: 基于Java Config启动新Spring项目的每个人都使用
    2019-01-08
  • 关于Spring中Bean的创建进行更多方面的控制

    关于Spring中Bean的创建进行更多方面的控制

    我们知道Spring Boot 中一个@Controller修饰的Bean是在什么时间被创建的,那么这个Bean创建时间能不能由我们管控?答案是肯定的 关于Spring中Bean的创建,除了
    2019-01-08
  • Spring中自动装配的4种方式

    Spring中自动装配的4种方式

    Spring容器可以在不使用<constructor-arg>和<property>元素的情况下自动装配相互协作的bean之间的关系,助于减少编写一个大的基于Spring的应用程序的XML配置的
    2019-01-08

最新评论