stream2000

Results 10 comments of stream2000

感谢PR!最近我也有点小忙😢 晚上或者明天一定会看看的!

感谢贡献捏😘代码看了一遍没什么问题,等前端那边对一下需求,看一下怎么适配就可以合入啦。

现在还没有捏,要不我assign给你了?

好的,这个涉及到线上环境,我测试之后再尝试修改版本,感谢建议捏

嗯,也可以针对所有赞数大于某个阈值的评论做出这样的处理,目前采取的策略还是保证一周内更新,之后需要尽量采用爬虫压力比较低的方式。

> 嗯嗯,这样也不错。那就要确定具体的阈值了。 > 还有,关于查重的部分,现有查重会查出完全不像的高重复率,我感觉可以参考[https://github.com/fanghon/antiplag](url)这个项目的代码。关于源码还没看,不过经过我小范围的测试,这个查重可以避免完全不像的高重复率,但是这样的方式会导致从整体截取一小短话的查重率偏低。 > 所有我感觉可以两种查重复方法混合实现:先采用该项目的查重方式过滤掉完全不像的高重复率,然后使用原先查重方法进一步查重。 >不过这样做在生产环境的性能就不知道了,是否可以接受还要进一步测试。 好的,谢谢建议!目前的算法确实存在准确率的缺陷,我们也在尝试寻找新的算法了,这个仓库我们会参考的~

You can try the following spark SQL: ```sql call hive_sync(table => 'a', metastore_uri => 'uri'); ``` All the params are as follows: ```scala private val PARAMETERS = Array[ProcedureParameter]( ProcedureParameter.required(0, "table",...

Let's provide more details in the PR description explaining why this PR is necessary. Also, are there plans to support different types of filesystem view locks in the future?