Andy Sun

Results 35 comments of Andy Sun

求Pull Request

@xxllp , 对table的处理有个bug,已经修复了。 http://jparser.duapp.com/parser?url=http%3A%2F%2Fwww.bbcg.gov.cn%2Fdisplay.asp%3Fid%3D2327

基本思路:首先找到备选的两个叶子节点(字数最多或次多), 然后求他们的最低公共节点,最后把这个节点下的文字和图片提取出来。 找备选的时候,页面上方的权重比下方要高,是综合打分的。

@xxllp , 0.0.16 版,试试: http://jparser.duapp.com/parser?url=http%3A%2F%2Fcgfj.bda.gov.cn%2Fcms%2Fdwjs%2F140817.htm

@xxllp , 用最新版试试。