blog icon indicating copy to clipboard operation
blog copied to clipboard

基于机器学习的垃圾短信过滤应用

Open qiwihui opened this issue 6 years ago • 4 comments

基于机器学习的垃圾短信过滤

  1. Scikit-Learn 短信过滤模型训练,

  2. iOS CoreML介绍

  3. 使用 coremltools 将 Scikit-Learn 的模型转为 CoreML 的 mlmodel

  4. iOS App功能实现,界面编写

    • 导入模型并使用
    • 界面UI
    • 自定义黑白名单:号码,关键词
    • 提交辅助样本
  5. 调试

  6. App发布

  7. 优化模型大小,App大小及性能

qiwihui avatar Sep 10 '18 05:09 qiwihui

博主,你好! 能否分享一些如何使用 LinearSVC 对 RubbishMessage 数据训练的过程? 根据 RubbishMessage 的 readme.txt, 我运行 python keyWords.py 运行报错如下图: image 我看这两篇文章,基本了解了一下什么是 Linear SVCSVM 。 现在我的困境是在大概了解个算法(起码有个简单 example 可以模仿)和有训练数据的情况下,如何利用 LinearSVC 对 RubbishMessage 进行训练,这就难倒我了。我也是机器学习菜鸟,希望博主能分享一下您当时的心得,谢谢。

SunsetWan avatar May 04 '19 18:05 SunsetWan

@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。

qiwihui avatar May 05 '19 03:05 qiwihui

@SunsetWan 你可以参考我在SMSFilter项目中添加的 训练notebook,这里面做了数据分析和模型训练。大概过程是:分析数据,处理数据(结巴分词),提取特征(TF-IDF),训练(LinearSVM),模型评估和模型转换为CoreML的格式。

好的,谢谢!

SunsetWan avatar May 05 '19 13:05 SunsetWan

作者,你好,这东西,我能用安卓实现吗?😂

FeiLongTang avatar Dec 03 '21 12:12 FeiLongTang