【fruitdatakings水果数据王】
类型
传统媒体
网站地址
https://www.fruitdatakings.com
网站描述
获取每周更新的世界主要水果市场批发和零售价格信息。
https://www.fruitdatakings.com/services/
需要生成什么内容?
樱桃和猕猴桃的图片和文章
https://www.fruitdatakings.com/rss_category/
这边可以勾选品种,但没找到rss链接,开发者工具也没找到对应品种的链接,似乎是通过js发送查询
樱桃 https://www.fruitdatakings.com/china/cherry/
猕猴桃 https://www.fruitdatakings.com/eu/kiwi/
额外描述
#感谢
这不是重复的 RSS 请求
- [x] 我已经搜索了现有 issue 和 pull requests,以确保该 RSS 尚未被请求。
fruitdatakings.com 的樱桃和猕猴桃页面内容是通过 JavaScript 动态加载的,目前没有直接的 RSS 链接。根据 RSSHub 的最佳实践,可以通过 Puppeteer 在无头浏览器中渲染页面,等待内容加载后提取图片和文章,再生成 RSS。RSSHub 已有成熟的 Puppeteer 路由实现模式,包括请求拦截、等待特定元素、反爬检测和缓存等机制,适合处理这种 JS 渲染的数据源(如微博、小红书等)示例1 示例2。
开发时建议:用 Puppeteer 打开目标页面,拦截非必要资源(如图片、字体),等待主要内容渲染后,抓取页面中的图片和文章内容。可通过分析页面 JS 变量(如 window.INITIAL_STATE)或 DOM 结构提取数据。遇到反爬或验证码时可抛出异常并缓存结果,避免频繁触发风控。生成 RSS 时可用 description 字段嵌入图片和富文本,或用 Media RSS 字段增强兼容性参考。
如果目标站点有更复杂的反爬措施(如 WAF、验证码),可结合 Puppeteer 获取初始 Cookie,再用 ofetch 拉取详情页,或配置代理。RSSHub 的 Puppeteer 工具链已支持这些场景代码实现。
目前仓库未有 fruitdatakings.com 的现成路由,需自定义开发。技术上完全可行,方案与微博、小红书等 JS 动态站点类似。
To reply, just mention @dosu.
How did I do? Good | Irrelevant | Incorrect | Verbose | Hallucination | Report 🐛 | Other