七夕就要到了,在这个有情人终成眷属的好日子里,小安在这里给大家带来Python的小福利,在七夕利用Python制造两个人之间的甜蜜。二人世界里少不了属于两个人之间的甜言蜜语,而这些悄悄话也是记录了两个人从相识到相知再到在一起的甜蜜。
如果我们把这些甜言蜜语都收集起来,做成一个心爱的甜心,在七夕节的当天送给自己的另一半。这样既用心,而且还很甜蜜的操作,是不是很酷!说干就干,接下来,小安就带领大家,从数据的收集,再到数据的预处理,最终形成一个爱心展示,为大家制作一个七夕节的小惊喜。
1
数据的准备
首先,小安由于平时玩qq比较多,所以决定以qq来为大家做展示。这里小安怕会泄露个人的隐私,索性就以平时交流比较多的群聊天记录作为数据材料,大家只需要按照步骤来操作即可。
数据的获取,大家直接按照上图所示,找到自己的“目标”,然后右键,点击保存聊天记录即可,小安这里呢,将数据保存为txt文件,方便后续的操作。(因为小安是单身,没有mm跟我聊天,每天都是数据分析,机器学习研究和数据挖掘,所以只有技术的聊天记录)
保存的数据如下图所示:
2
数据的处理
数据获取完毕之后,接下来就是数据的预处理了,上面大家可以发现,数据中充斥着大量的数字、标点符号、字母等干扰因素,而我们平时都是以中文交流,所以在进行数据处理的时候,直接选择匹配中文是一个非常高效而且明智的选择。数据处理的代码如下图所示:
我们将处理好的数据放到新的文件夹里,以方便后续操作。接下来,就是定制特定爱心的时间了,我们利用的是jieba分词和wordcloud的词云制作,代码如下图所示:
产生的效果如下图所示:
到了这里,就结束了吗?No,No,No怎么可能,七夕节的礼物就要付出更多的精力!
3
在线词云做爱心
下面小安为大家安利一个在线的词云制作,定制出更加完美的词云。在线词云制作的链接为:http://yciyun.com/,界面如下图所示:
在模板模块里,大家可以选择是心形还是其他形状。在配置里大家可以选择更改背景的颜色。最重要的是数据模块,大家需要注册,然后才能在自定义编辑里更改数值,而且由于其字体限制为3号到9号。
可能大家会想,这个多的数值要更改到什么时候为止呢,别担心,小安已经帮大家写好程序了,大家只需要运行程序中的online_wordcloud函数即可。
最后,为大家展示的经过在线词云制作的爱心图片:
大家如果想让背景透明的话,需要开通会员,大家喜欢的话,可以直接开通。将上面的爱心图制作成大幅图画,在周围点缀上两人的甜蜜照片,做成画框,这样的一副作品简直是七夕节最美的礼物了,大家赶快动手做起来吧。