stream2000 comments

Results 10 comments of


                                            stream2000

feat: 初版随机小作文

感谢贡献捏😘代码看了一遍没什么问题，等前端那边对一下需求，看一下怎么适配就可以合入啦。

点赞数刷新策略更新

嗯，也可以针对所有赞数大于某个阈值的评论做出这样的处理，目前采取的策略还是保证一周内更新，之后需要尽量采用爬虫压力比较低的方式。

> 嗯嗯，这样也不错。那就要确定具体的阈值了。 > 还有，关于查重的部分，现有查重会查出完全不像的高重复率，我感觉可以参考[https://github.com/fanghon/antiplag](url)这个项目的代码。关于源码还没看，不过经过我小范围的测试，这个查重可以避免完全不像的高重复率，但是这样的方式会导致从整体截取一小短话的查重率偏低。 > 所有我感觉可以两种查重复方法混合实现：先采用该项目的查重方式过滤掉完全不像的高重复率，然后使用原先查重方法进一步查重。 >不过这样做在生产环境的性能就不知道了，是否可以接受还要进一步测试。好的，谢谢建议！目前的算法确实存在准确率的缺陷，我们也在尝试寻找新的算法了，这个仓库我们会参考的~

stream2000

feat: 初版随机小作文

feat: 初版随机小作文

增加随机小作文

celery5.1.0兼容问题

点赞数刷新策略更新

点赞数刷新策略更新

[HUDI-7246] Fix Data Skipping Issue: No Results When Query Conditions Involve Both Columns with and without Column Stats

[HUDI-7246] Fix Data Skipping Issue: No Results When Query Conditions Involve Both Columns with and without Column Stats

[SUPPORT] Connect to standalone hive metastore rather than JDBC

[HUDI-7156] Abstract an independent hoodie table filesystem view lock