xxl-crawler
xxl-crawler copied to clipboard
使用HtmlUnitPageLoader加载的页面获取不到当前页面url
Document html = Jsoup.parse(pageAsXml);
返回的html没有baseurl,后期使用获取不到,如图
手工set了一下
Document html = Jsoup.parse(pageAsXml);
html.setBaseUri(pageRequest.getUrl());