blog
blog copied to clipboard
基于机器学习的垃圾短信过滤应用
基于机器学习的垃圾短信过滤
-
Scikit-Learn 短信过滤模型训练,
- 模型,SVM
- 判断是不是垃圾短信
- 判断短信类型
- 数据,wandouqiang/RubbishMessage
- 训练
- 评估
- 模型,SVM
-
iOS CoreML介绍
-
使用 coremltools 将 Scikit-Learn 的模型转为 CoreML 的 mlmodel
-
iOS App功能实现,界面编写
- 导入模型并使用
- 界面UI
- 自定义黑白名单:号码,关键词
- 提交辅助样本
-
调试
-
App发布
-
优化模型大小,App大小及性能
博主,你好!
能否分享一些如何使用 LinearSVC 对 RubbishMessage 数据训练的过程?
根据 RubbishMessage 的 readme.txt, 我运行 python keyWords.py
运行报错如下图:
我看这两篇文章,基本了解了一下什么是 Linear SVC 和 SVM 。
现在我的困境是在大概了解个算法(起码有个简单 example 可以模仿)和有训练数据的情况下,如何利用 LinearSVC 对 RubbishMessage 进行训练,这就难倒我了。我也是机器学习菜鸟,希望博主能分享一下您当时的心得,谢谢。
@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。
@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。
好的,谢谢!
作者,你好,这东西,我能用安卓实现吗?😂