Results 5 issues of likanug

#239 的实现,这是我第一次知道这这个网站,很有价值,感谢这位网友提供数据源地址

#271 36氪人气榜的数据源,并且解除了代码中对cloudeflare的限制

我在做提取新闻关键字时候,发现每条新闻的id都千奇百怪,有的是url、有的是随机数字,甚至有的还是证券代码。 当将所有新闻提取到数据库持久化以后,对根据新闻关键字溯源,根据新闻id查找新闻一点也不友好,也不利于对新闻进行数据分析做拓展。 基于我个人的需求,以及为以后项目的拓展做准备,所以我定义并实现了一个生成统一格式的新闻id的函数,这个函数基于新闻的url,做sha256的哈希,然后默认是取32位的长度,由于每条新闻的url是唯一的,所以生成的id也是唯一的,至少在百亿级别条新闻上能保证新闻id唯一。 统一格式和长度的新闻id在数据库或者es中也好做索引和检索,当然也不强制其他人去重构这个新闻id的问题,这个生成id的函数侵入性很小,使用方式也很简单,函数的注释也很详细,当大家发现没有新闻id可以使用的时候,这会是一个很好的备选方案。我也重构了几个数据源的id作为示例,大家可以参考选择性使用。

fix #1427 - [x] By selecting this checkbox, I agree to license my contributions to this project under the license(s) described in the LICENSE file, and I have the right...

mach on  main [!] via ↯ v0.14.0-dev.2577+271452d22 took 29s ➜ zig build run-core-custom-entrypoint run-core-custom-entrypoint └─ run core-custom-entrypoint └─ zig build-exe core-custom-entrypoint Debug native 1 errors src\entrypoint\main.zig:7:29: error: root source...

bug
needs-triage