R语言不仅有丰富的包可以用于数据统计分析,而且可以对数据进行可视化。这边文章主要介绍下如何用R语言绘制词云。
工具:
- R语言IDE
- ggplot2包
- wordcloud包
安装作图包
因为绘制词云需要用到ggplot2包和wordcloud包。所以,可以在R studio输入如下命令,需要选择mirror:
chooseCRANmirror()
之后,就可以在这个镜像中安装需要的作图包:
install.packages("ggplot2")
install.packages("wordcloud")
预备数据
绘制词云需要的数据格式就是“词语\t权重”,我们可以将每个topic的词语放在一个文本文档中,有多少个topic就绘制多少张词云图。
如下是一个topic的词语:
绘制词云
如下代码便用于生成词云。其中,path为所有topic的文本文档所在路径。topicNum为topic的个数。接下来就是调用作图包进行绘制,其中字体,大小都可以设定,但是其它很多字体绘制出来的词云会出现词语重叠的现象,很奇怪,目前我也不知道什么原因。希望哪位前辈能指教一下,不胜感激。
|
|
最后,绘制得到的结果示例: