nagisa-tutorial-pycon2019 icon indicating copy to clipboard operation
nagisa-tutorial-pycon2019 copied to clipboard

Code for PyCon JP 2019 talk "Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜"

Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜

  • 発表スケジュール: 2019/09/16 14:40-15:10 (30min)
  • 場所: D会議室
  • レベル: Beginner
  • 発表/資料: JP
  • 発表スライド: nagisa-tutorial-pycon2019.pdf
  • Speaker Deck: Slides

nagisa による単語分割と品詞タグ付けの実装方法

  1. 基本的な使い方: basic_usage.ipynb [Colab notebook]
  2. ワードクラウドの作成: word_cloud.ipynb [Colab notebook]

Python による固有表現抽出モデルの実装方法

  1. 事前準備: Speaker Deck
  2. 京都大学ウェブ文書リードコーパスの前処理: preprocess_kwdlc.py
  3. 固有表現抽出モデルの学習: train_kwdlc_model.py
  4. 学習済みモデルの利用方法: predict_kwdlc_model.py
  5. 固有表現ごとの正解率の確認: evaluate_kwdlc_model.py

参考リンク