Resources-about-NLP icon indicating copy to clipboard operation
Resources-about-NLP copied to clipboard

自己收集的一些互联网上的文章和博客,主要关于NLP/DL/ML/Python/比赛/找工作等,如有侵权请告知删除。

Resources-about-NLP

Machine Learning

决策树算法原理(上)

决策树算法原理(下)

这可能是你看过的最用心的【决策树算法】介绍文章

RF、GBDT、XGBoost面试级整理

通俗理解kaggle比赛大杀器xgboost

机器学习面试之各种优化器的比较

简单的交叉熵损失函数,你真的懂了吗?

漫谈:机器学习中距离和相似性度量方法

EM-最大期望算法

为什么L1稀疏L2平滑?

Deep Learning

RNN

RNN

RNN - LSTM - GRU

LSTM细节分析理解(pytorch版)

RNN/LSTM BPTT详细推导以及梯度消失问题分析

PyTorch 训练 RNN 时,序列长度不固定怎么办?

RNN 的梯度消失问题

文本分类

在文本分类任务中,有哪些论文中很少提及却对性能有重要影响的tricks?

语义相似度

深度学习解决 NLP 问题:语义相似度计算

浅析文本相似度

Seq2Seq & Transfomer & Attention

真正的完全图解Seq2Seq Attention模型

Transformer 模型的 PyTorch 实现

哈佛大学的Transformer实现

Details Need More Attention: Transformer 没有被提到的细节

NLPer看过来,一些关于Transformer的问题整理

Attention? Attention!

transformer中的attention为什么scaled?

为什么Transformer 需要进行 Multi-head Attention?

训练技巧

对Focal Loss的认识

词向量

nlp中的词向量对比:word2vec/glove/fastText/elmo/GPT/bert

doc2vec原理及实践

GloVe与word2vec的区别

Word2vec数学原理全家桶

NLP传统模型

用TF特征向量和simhash指纹计算中文文本的相似度

NLP点滴——文本相似度

海量数据去重之SimHash算法简介和应用

Python进阶

关于python的面试题

python自测100题

数学基础

distribution-is-all-you-need

比赛经验

AI Challenger 2018 文本挖掘类竞赛相关解决方案及代码汇总

Kaggle混分记

Kaggle QIQC比赛总结

AI Challenger 2018 细粒度用户评论情感分析,排名17th

大数据题

海量数据中找出前k大数(topk问题)

教你如何迅速秒杀掉:99%的海量数据处理面试题

https://github.com/imhuay/Algorithm_Interview_Notes-Chinese)

智力题

热门智力题 过桥问题和倒水问题

六道腾讯、百度、美团常爱问的面试智力题和答案