WordCloudを使って単語の頻出度を画像化してみました。
使われている単語の回数が多いほど、単語は大きくなります。
今回は、簡単に説明するために、単語を半角スペースで並べた文章を用意しました。
サンプルコードを記載します。
"""
WordCloudのサンプル
WordCloudは、キーワードを画像に可視化するものです。
使われているキーワードの回数が多いほど、文字が大きくなります。
以下のコードを実行すると、使われている回数が最も多い「非モテ」というキーワードの画像が一番大きくなる
"""
from wordcloud import WordCloud
#文字列に変換する
text = "非モテ 非モテ 非モテ 男 女 男 モテ モテ男 モテ男 天丼 穴子丼 非 トイレ"
wordcloud = WordCloud(background_color="white",
font_path="/System/Library/Fonts/ヒラギノ明朝 ProN.ttc",
width=800,height=600).generate(text)
wordcloud.to_file("./wordcloud_sample.png")
GitHub
https://github.com/jshirius/python_tools/blob/master/word_cloud_sample_short.ipynb
このプログラムを実行すると、以下のような画像が生成されます。
この例では「非モテ」という単語が最も多く使われているので、「非モテ」が最も大きい画像になっていることがわかるかと思います。
実際は、文章を形態素分析して単語に分解してから使います。
以上、WordCloudを使った例でした。
■参考サイト
WordCloudの公式サイト
http://amueller.github.io/word_cloud/index.html