| 注册
首页|期刊导航|计算机工程与应用|基于MapReduce的海量数据挖掘技术研究

基于MapReduce的海量数据挖掘技术研究

李伟卫 赵航 张阳 王勇

计算机工程与应用Issue(20):112-117,6.
计算机工程与应用Issue(20):112-117,6.DOI:10.3778/j.issn.1002-8331.1201-0298

基于MapReduce的海量数据挖掘技术研究

Research on massive data mining based on MapReduce

李伟卫 1赵航 2张阳 1王勇3

作者信息

  • 1. 西北农林科技大学 信息工程学院,陕西 杨凌 712100
  • 2. 西安电子科技大学 机电工程学院,西安 710072
  • 3. 西北工业大学 计算机学院,西安 710072
  • 折叠

摘要

Abstract

MapReduce is a programming model which can run in a heterogeneous environment for mining massive volume of data. It is simple to be implemented without paying attention to the underlying details and can be used for large-scale parallel computing. In this paper, three data mining algorithms, Naive Bayes, K-modes, ECLAT are implemented by employing the MapReduce programming model. The results indicate that MapReduce can perform the data mining tasks on massive volume of data efficiently.

关键词

云计算/数据挖掘/Hadoop/MapReduce

Key words

cloud computing/data mining/Hadoop/MapReduce

分类

信息技术与安全科学

引用本文复制引用

李伟卫,赵航,张阳,王勇..基于MapReduce的海量数据挖掘技术研究[J].计算机工程与应用,2013,(20):112-117,6.

基金项目

国家自然科学基金(No.60873196);中央高校基本科研业务费专项资金(No.QN2009092)。 ()

计算机工程与应用

OACSCDCSTPCD

1002-8331

访问量0
|
下载量0
段落导航相关论文