PythonのライブラリーWordCloudで単語の頻出度を画像化してみた

WordCloudを使って単語の頻出度を画像化してみました。
使われている単語の回数が多いほど、単語は大きくなります。

 

今回は、簡単に説明するために、単語を半角スペースで並べた文章を用意しました。
サンプルコードを記載します。


"""
WordCloudのサンプル
WordCloudは、キーワードを画像に可視化するものです。
使われているキーワードの回数が多いほど、文字が大きくなります。

以下のコードを実行すると、使われている回数が最も多い「非モテ」というキーワードの画像が一番大きくなる
"""

from wordcloud import WordCloud

#文字列に変換する
text = "非モテ 非モテ 非モテ 男 女 男 モテ モテ男 モテ男 天丼 穴子丼 非 トイレ"

wordcloud = WordCloud(background_color="white",
    font_path="/System/Library/Fonts/ヒラギノ明朝 ProN.ttc",
    width=800,height=600).generate(text)

wordcloud.to_file("./wordcloud_sample.png")

GitHub

https://github.com/jshirius/python_tools/blob/master/word_cloud_sample_short.ipynb

 

このプログラムを実行すると、以下のような画像が生成されます。

 

WordCloudを使った画像

この例では「非モテ」という単語が最も多く使われているので、「非モテ」が最も大きい画像になっていることがわかるかと思います。

実際は、文章を形態素分析して単語に分解してから使います。

以上、WordCloudを使った例でした。

 

■参考サイト
WordCloudの公式サイト
http://amueller.github.io/word_cloud/index.html

最新情報をチェックしよう!
>プログラミングスクール検索・比較表サイト

プログラミングスクール検索・比較表サイト

ワンクリック、さらに詳細に条件を指定してプログラミングスクールの検索ができます。さらに比較表により特徴を細かく比較できる!

CTR IMG