Blog
Blog copied to clipboard
深夜Debug发现的一个坑
深夜Debug发现的一个坑
标签(空格分隔): 前端 浏览器 爬虫 NodeJS
使用NodeJS写爬虫来获取一些信息,解析table
的时候居然出错了。在选择器中使用tbody
来去除thead
中的数据,但是选择器中一旦出现tbody
,就什么都选不出来了。
明明是使用浏览器的开发者模式找出来的选择器,怎么会出问题呢,而且选择器选择thead
的时候还好好的。
最后灵机一动,直接查看网页源码,根本就没有tbody
这个东西嘛。
搜索资料发现:
一个表格应该有表头,若直接写tr>td这样的结构,浏览器会自动创建一个tbody包裹
看来浏览器也不是百分之百可以相信的呀。