hihobot
hihobot copied to clipboard
自分のチャットボットを作る
hihobot
自分のチャットボットを作る
作り方
必要なライブラリの準備
pip install -r requirements.txt
必要なファイルの準備
学習済みのdoc2vecモデルが必要です。 私は、pixiv小説で学習されたモデルをお借りしました。 下の3ファイルが必要です。
doc2vec.model
doc2vec.model.syn0.npy
doc2vec.model.syn1.npy
学習データセットの準備
1.文章ごとに改行で区切られたテキストファイルを作成
サンプルテキスト1
サンプルテキスト2
マストドンの場合は、outbox機能を使ってテキストファイルを作るコードがあります。 (extract_text_from_mastodon.py)
2.データセット作成用のコマンドを実行
make_dataset.py
3.設定ファイルを用意
サンプル設定ファイル.json
{
"dataset": {
"char_path": "/path/to/dataset_char.json",
"text_path": "/path/to/dataset_text.json",
"doc2vec_model_path": "/path/to/doc2vec.model",
"seed": 0,
"num_test": 100
},
"network": {
"n_layers": 2,
"in_size": 2148,
"hidden_size": 128,
"out_size": 2049,
"dropout": 0.2
},
"loss": {
},
"train": {
"batchsize": 50,
"gpu": 0,
"log_iteration": 100,
"prune_iteration": 10000,
"snapshot_iteration": 10000,
"stop_iteration": 100000,
"optimizer": {
"name": "adam"
},
"optimizer_gradient_clipping": 5.0,
"linear_shift": {
"attr": "alpha",
"value_range": [
0.01,
0.001
],
"time_range": [
2000,
50000
]
}
},
"project": {
"name": "",
"tags": []
}
}
4.学習
train.pyで学習できます。
文章の生成
generate.pyで文章を生成できます。
その他
hihobot_ttsでAPIとして使えます。
ライセンス
MIT License