大数据培训课程:Hadoop技术的优缺点
今天,我们正被数据包围。全球43亿部电话、20亿位互联网用户每秒都在不断地产生大量数据,人们发送短信给朋友、上传视频、用手机拍照、更新社交网站的信息、转发微博、点击广告等,使得机器产生和保留了越来越多的数据。数据的指数级增长对处于市场领导地位的互联网公司,如Facebook、谷歌、雅虎、亚马逊、腾讯等提出了挑战。它们需要对TB级别和PB级别的数据进行分析处理,以发现哪些网站更受欢迎,哪些商品更具有吸引力,哪些广告更吸引用户。传统的工具对于处理如此规模的数据集越来越无能为力。
现在,Hadoop应运而生,庞大的信息流有了新的处理平台。今天千锋深圳大数据培训老师给大家分享::Hadoop技术的优缺点。
1、Hadoop的优点
(1)Hadoop具有按位存储和处理数据能力的高可靠性。
(2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。
(3)Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。
(4)Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错性。
2、Hadoop的缺点
(1)Hadoop不适用于低延迟数据访问。
(2)Hadoop不能高效存储大量小文件。
(3)Hadoop不支持多用户写入并任意修改文件。
Hadoop的核心组件
3、Hadoop版本简介
Hadoop自诞生以来,主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。
HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的很多组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1之后出现了Hadoop2,Hadoop2在Hadoop1的基础上做了改进。相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2。
Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下:
(1)Hadoop Common:为其他Hadoop模块提供基础设施。
(2)HDFS:具有高可靠性、高吞吐量的分布式文件系统。
(3)MapReduce:基于Yarn系统,分布式离线并行计算框架。
(4)Yarn:负责作业调度与集群资源管理的框架。
Hadoop技术俨然成为大数据的关键点,也是大数据开发课程的重中之重,学习更多Hadoop技术知识,尽在千锋深圳大数据培训!
相关推荐HOT
更多>>女生可以去计算机前端培训班吗?
女生可以去计算机前端培训班吗?其实,在前端开发技术的掌握和运用上女生可以做到完全不逊色于男生的,要知道Web前端开发早已不是男生们的天下,...详情>>
2022-11-21 11:19:00web前端培训机构哪家好?学完就业如何
web前端培训机构哪家好?作为开放式网络平台的主力选手,web标准正在经历着渐进、改善,甚至根本性的变革。虽然早在多年之前,这项技术就已经开...详情>>
2022-11-18 11:23:00哪个软件测试培训机构好?主要学什么
哪个软件测试培训机构好?随着近几年来软件测试的火热,入行的年轻人在增加!但软件测试作为一门入门易,深入难的IT学科,重要的还是需要理解什么...详情>>
2022-11-11 11:29:00无基础学python到入职需要多久?
无基础学python到入职需要多久?如果你是考虑自学的话,那估计要花费的时间比较不好计量,因为自学本身依靠的就是自己的自制力,此外手头的资料...详情>>
2022-11-10 11:19:00