blog
                                
                                
                                
                                    blog copied to clipboard
                            
                            
                            
                        基于机器学习的垃圾短信过滤应用
基于机器学习的垃圾短信过滤
- 
Scikit-Learn 短信过滤模型训练,
- 模型,SVM
- 判断是不是垃圾短信
 - 判断短信类型
 
 - 数据,wandouqiang/RubbishMessage
 - 训练
 - 评估
 
 - 模型,SVM
 - 
iOS CoreML介绍
 - 
使用 coremltools 将 Scikit-Learn 的模型转为 CoreML 的 mlmodel
 - 
iOS App功能实现,界面编写
- 导入模型并使用
 - 界面UI
 - 自定义黑白名单:号码,关键词
 - 提交辅助样本
 
 - 
调试
 - 
App发布
 - 
优化模型大小,App大小及性能
 
博主,你好!
能否分享一些如何使用 LinearSVC 对 RubbishMessage 数据训练的过程?
根据 RubbishMessage 的 readme.txt, 我运行 python keyWords.py
运行报错如下图:
我看这两篇文章,基本了解了一下什么是 Linear SVC 和 SVM 。
现在我的困境是在大概了解个算法(起码有个简单 example 可以模仿)和有训练数据的情况下,如何利用 LinearSVC 对 RubbishMessage 进行训练,这就难倒我了。我也是机器学习菜鸟,希望博主能分享一下您当时的心得,谢谢。
@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。
@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。
好的,谢谢!
作者,你好,这东西,我能用安卓实现吗?😂