1.nutch
站在用户的角度思考问题,与客户深入沟通,找到乌苏网站设计与乌苏网站推广的解决方案,凭借多年的经验,让设计与互联网技术结合,创造个性化、用户体验好的作品,建站类型包括:网站建设、成都网站建设、企业官网、英文网站、手机端网站、网站推广、域名与空间、虚拟空间、企业邮箱。业务覆盖乌苏地区。
地址:apache/nutch · GitHub
apache下的开源爬虫程序,功能丰富,文档完整。有数据抓取解析以及存储的模块。
2.Heritrix
地址:internetarchive/heritrix3 · GitHub
很早就有了,经历过很多次更新,使用的人比较多闭拆,功能齐全,文档完整,网上的资料也多。有自己的web管理控制台,包含了一个HTTP 服务器。操作者可以通过选择Crawler命令来操作控制台。
3.crawler4j
地址:yasserg/crawler4j · GitHub
因为只拥有爬虫的核心功能,所以上手极为简单,几分钟就可以写一个多线程爬虫程序。
当然,上面说的nutch有的功能比如数据存储不代表Heritrix没有哗镇,反之亦然。具体使用哪个合适还需要仔细阅读文档并配合实验才能下结论啊~
还有比轿芦枣如JSpider,WebEater,Java Web Crawler,WebLech,Ex-Crawler,JoBo等等,这些没用过,不知道。。。
爱考在线考试系统 1.2.1 版本 web浏览 全国唯一开源免费在线考试系统 1.支持几乎所有的题型,包括选择题,判断题,填空题,问答题,复合题(选词,完型填空,阅读理解),多棚瞎兄空选择题,连线题等; 2.支持智能出卷,让您可以根据题型,章节(知识分类),试题难度,分值等组成一份完整的试卷; 3.支持在线练习或考试,并能设置考试链袭的考生(或员工)范围,时间。让您能轻松组织一场在线考试; 4.支持客观题自动判卷以及主观题手动判卷,并能自动核计总分,并统计排名,生成成绩分析报表; 5.简化录入试题功能,支持智能识别,能极大简化你的录入工作; 6.支持共享题库。让用户可以从爱考网下载试题,试卷,让您分享海量题库。 免除自己录题的烦恼; 7.是免费开源的在线考试系统,您不神衫需要为此支付任何费用,并且可以下载源代码以供学习和研究。