Hadoop有哪些优缺点

优点:

  1. Hadoop具有按位存储和处理数据能力的高可靠性。
  2. Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。
  3. Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。
  4. Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错。

缺点:

  1. Hadoop不适用于低延迟数据访问。
  2. Hadoop不能高效存储大量小文件。
  3. Hadoop不支持多用户写入并任意修改文件。

Hadoop是专为离线和大规模数据分析而设计的,其功能如下:

  1. 大数据存储:分布式存储
  2. 日志处理:擅长日志分析
  3. ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库
  4. 机器学习: 比如Apache Mahout项目
  5. 搜索引擎:Hadoop + lucene实现
  6. 数据挖掘:目前比较流行的广告推荐,个性化广告推荐

类似文章

发表评论

您的电子邮箱地址不会被公开。