QueryList icon indicating copy to clipboard operation
QueryList copied to clipboard

:spider: The progressive PHP crawler framework! 优雅的渐进式PHP采集框架。

Results 35 QueryList issues
Sort by recently updated
recently updated
newest added

测试页面:[链接](https://mp.weixin.qq.com/s?__biz=MzAwNDMzNjA2Mg==&mid=2247484174&idx=1&sn=568d3ff2fcf0381030a7c53293aa2ed1&scene=21#wechat_redirect) QL代码: `$dom='html > body > div:nth-of-type(1) > div:nth-of-type(2) > div:nth-of-type(1) > div > div:nth-of-type(1) > div:nth-of-type(3) > section:nth-of-type(2)';$print=$QueryList->find($dom)->htmlOuter();` ql版本:`两年前至最新版都一样结果.` 抓取到的内容:`"

你好,我在查找图片img的html元素时,通过htmlOuter获取源html字符串内容,但是发现会缺失了后面的斜杠/字符 ``` $html = '测试'; $pq = \phpQuery::newDocument($html); $imgs = $pq->find('img'); dd($imgs[0]->htmlOuter()); // 这里打印出来的是: 可以看到对比原来的html,少了后面的斜杠 ``` 这个是问题,还是故意这样呢?可以修复下吗

【运行环境】 PHP 7.4.33 【执行代码】 $data = QueryList::get('http://www.baidu.com/s?wd=QueryList') // 设置采集规则 ->rules([ 'title'=>array('h3','text'), 'link'=>array('h3>a','href') ]) ->query()->getData(); print_r($data->all()); 【实际执行结果】 Array ( [title] => QueryList|优雅的渐进式PHPDOM解析框架快速上手 - QueryList文档QueryList - 简洁、优雅的 PHP 采集工具(爬虫)PHP爬虫框架 Querylist_腾讯新闻抓取网页工具querylist的使用简介 - 简书简单的使用QueryList爬取数据_弟弟小王的博客-CSDN博客PHP框架...

代码如下: `$url = $_GET['url'] ?? "https://ishere.cn/"; $data = QueryList::get($url)->encoding('UTF8')->rules( [ 'title' => ['a', 'text'], 'link' => ['a', 'href'] ] )->query()->getData();` 执行结果如下: `{ "title": "首页与我取得联系在之前。。忽略中间所有文字。。。rtPanel WordPress Theme Framework鲁ICP备14011120号", "link": "http:\/\/ishere.cn\/" }`...

Hello, I am using Querylist and made some changes for php8.1. Though, I cannot upload my branch. Could you give me access? Best regards, Dimitris Dimopoulos

现在要升级到php8/laravel9,发现composer报错。可否优先支持一下?🙏 多谢作者!