梦里茶
梦里茶
@GuZhebin http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 可以看下这个LSTM的文章,写的很好
@yangkun1993 有点像是你的数据集有问题,image可能是空的(看第一行的size 0),然后在执行batch的时候batch_size 为40大于0,所以报out of range
@tyr2000 Lenet5的模型跟我的代码里的cnn部分很像,都是卷积层套pool套mlp,只不过具体超参数可以自己调整,可以参考Lesson3的代码看看
@sunxiaobiu 按我的理解 beam search是一种预测的策略,不是权重更新的策略,预测多个字符就是beam search,你的sample函数的是用在哪里的呢?没有找到调用的地方,如果你现在是单字符预测的话,改成多字符预测就算是用上beam search了
@sunxiaobiu 据我所知没有现成的beam search,要实现这种多字符的预测,在做word embedding的时候就要从多字符做起,多字符的代码可以看[这个](https://github.com/ahangchen/GDLnotes/blob/master/src/rnn/bigram_lstm.py)
@skyoflovehc 我这里只有英文的字幕,链接在笔记里有,其实那些英文都是这个领域常见的词,建议看英文,看的时候查一查也增强一下理解
@Prayforhanluo 不是python版本的问题,是你的输入x和y的类型不匹配,可以把x也转为float32再去进行那个mul的乘操作
@flaght [Lesson 1](https://github.com/ahangchen/GDLnotes/blob/master/note/lesson-1/practical.md)中简要介绍了notMNIST,有下载链接
@flaght 这个是Google的视频教程里截图下来的,并不是我画的哦
@flaght 每个lesson对应的note都把视频地址放在最上面了