2021年版PKEライブラリーによる日本語キーフレーズ処理のサンプル・PKEをアップデートしたら動かなくなってしまった方へ

  • 2021年1月30日
  • 2021年1月30日
  • Python
  • 337view

2020年2月頃後にインストールしたPEK(Python Keyphrase Extraction)を使ってキーフレーズの処理を実装していたのだが、2021年1月29日にアップデートしたら、PEKの仕様変更により、使えなくなってしまいました。

原因は、変数「ISO_to_language」がなくなってしまったためです。

最新のPKEで日本語のキーフレーズ処理できる方法を解説します。

 

キーフレーズとは

キーフレーズ(key phrase)とは、検索するときに2つ以上の単語のことを指します。

例えば、「脱毛エステ」などが、「脱毛」と「エステ」が、組み合わさって構成されています。

 

PEKを使うと、文章から、意味があるキーフレーズを取り出してくれます。

 

 

修正方法

以前のPEKを使っていて、「ISO_to_language」の部分でエラーになっているなら、

以下の部分を修正すれば使えるようになります。

 

#修正前
#pke.base.ISO_to_language['ja_ginza'] = 'japanese'

#修正後
pke.base.lang_stopwords['ja_ginza'] = 'japanese'

 

なお、PEKの使い方、インストール方法などは、以下のサイトにて詳しく解説されています。

はじめての自然言語処理・第5回 pke によるキーフレーズ抽出

 

 

 

その上で、次にキーフレーズの取得する方法をコードにて解説します。

PKEの実装例

 

PKE実装例は以下の通です。

 

 

その結果、それらしく単語のつながりを表現できていると思います。

 

なお詳細な関数の説明などは、以下のサイトが大変参考になります。

 

第5回 pke によるキーフレーズ抽出

 

 

まとめ

以上、アップデートしたらPKEが使えなくなってしまった場合の修正方法でした。

アップデートしたら動かなくなることは、多々あるので、アップデートする前に、前バージョンのバックアップが必要になるかもしれません。

 

最新情報をチェックしよう!
>プログラミングスクール検索・比較表サイト

プログラミングスクール検索・比較表サイト

ワンクリック、さらに詳細に条件を指定してプログラミングスクールの検索ができます。さらに比較表により特徴を細かく比較できる!

CTR IMG