山东科学2015,Vol.28Issue(2):101-107,7.DOI:10.3976/j.issn.1002-4026.2015.02.017
基于MapReduce的网络爬虫设计与实现
MapReduce based web crawler design and implementation
摘要
关键词
Hadoop/MapReduce/网络爬虫/信息抽取/文本去重Key words
Hadoop/MapReduce/web crawler/information extraction/text deduplication分类
信息技术与安全科学引用本文复制引用
李晨,朱世伟,赵燕清,于俊凤..基于MapReduce的网络爬虫设计与实现[J].山东科学,2015,28(2):101-107,7.基金项目
山东省科学院青年基金(2013QN036) (2013QN036)
山东省科技发展计划(2013GGX10127 ()
2014GGX101013) ()