nagisa-tutorial-pycon2019
nagisa-tutorial-pycon2019 copied to clipboard
Code for PyCon JP 2019 talk "Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜"
Python による日本語自然言語処理 〜系列ラベリングによる実世界テキスト分析〜
- 発表スケジュール: 2019/09/16 14:40-15:10 (30min)
- 場所: D会議室
- レベル: Beginner
- 発表/資料: JP
- 発表スライド: nagisa-tutorial-pycon2019.pdf
- Speaker Deck: Slides
nagisa による単語分割と品詞タグ付けの実装方法
- 基本的な使い方: basic_usage.ipynb [Colab notebook]
- ワードクラウドの作成: word_cloud.ipynb [Colab notebook]
Python による固有表現抽出モデルの実装方法
- 事前準備: Speaker Deck
- 京都大学ウェブ文書リードコーパスの前処理: preprocess_kwdlc.py
- 固有表現抽出モデルの学習: train_kwdlc_model.py
- 学習済みモデルの利用方法: predict_kwdlc_model.py
- 固有表現ごとの正解率の確認: evaluate_kwdlc_model.py