iveely.search
iveely.search copied to clipboard
Pure java realize search engine, try to directly hit the user's search for answers.
同样是0.8.0,新版的爬虫用lucene了,前面的plugin全没了?我的天,这坑太大了。
1. `example conf` 可否改为 `conf` 或者 `conf-example` ? 2. `for brain` 可否改为 `brain` ? 3. `for crawler` 可否改为 `crawler` ? 文件夹名字中,多个单词的应该使用`-`连接,这样可读性更好。
程序的说明文档太少了,里面的内容虽然很丰富,但是作为开源软件,更多的是让其他人能够使用去感受作者的心血。程序本身涉及了很多方面的内容,且各程序之间很明显的区分开了。作为小白,也不算小白。根据作者的readme方案走不下去。建议作者能够扩充一下说明文档,让更多的人能够使用
很早就发现了这个项目,不过介入较浅,不时忘记了。现在是做垂直搜索才又发现。用了webmagic做爬虫,对比之下,webmagic的文档就好多了,怎样使用什么的都有,所以人家有2k多星就正常。Iveely Search Engine百度上搜索还是是很旧的文档,在开源中国上还是说用c#来写的,除了文档旧外,使用场景和使用方法等方面还需要深入的阐述一下。长期维持低的使用量和关注度,对开源项目本身发展不好,何况作者是辞工后专职来做的,这点为作者点赞。
采集时总是只会采集最后采集的网址。
搜索关键词时优先不匹配搜索词,反而优先匹配的是单个汉字。
搜索关键词时有时不出来内  容,看服务器提示有错误。
搜索关键词会优先把关键词分开去查找数据,而不是优先找与关键词相同的数据。
搜索分词有错误
搜索分词有错误
``` 能不能做到那种把一个网站里的所有的页面都索引出来,然后通过网址和关键词来搜索指定网址里关于关键词的内容的? 这样推广的话可以结合这种搜索与很多网站合作来弄,可能会方便很多。 ```