为了帮助更多正在学习大数据开发的同学更好的掌握Hadoop入门知识,下面,我们来一起了千锋深圳大数据培训学员的Hadoop入门学习心得。想通过视频了解Hadoop知识的同学,也可以通过千锋深圳大数据培训视频网站进行学习了解。
互联网的快速发展带来了数据快速增加,海量数据的存储已经不是一台机器所能处理的问题了。Hadoop的技术就应运而生。我们在千锋深圳大数据培训期间,在千锋老师的讲解之后,我们对这个概念有了一个比较系统的了解。可以讲Hadoop的核心内容看作是两个部分,一个是分布式存储,一个是分布式计算。
对于分布式存储,Hadoop有自己的一套系统来处理叫Hadoop distribution file system。为什么分布式存储需要一个额外的系统来处理呢,而不是就把1TB以上的文件分开存放就好了呢。如果不采用新的系统,我们存放的东西没办进行一个统一的管理。存放在A电脑的东西只能在连接到A去找,存在B的又得单独去B找。繁琐且不便于管理。而这个分布式存储文件系统能把这些文件分开存储的过程透明化,用户看不到文件是怎么存储在不同电脑上,看到的只是一个统一的管理界面。现在的云盘就是很好的给用户这种体验。
对于分布式计算。在对海量数据进行处理的时候,一台机器肯定也是不够用的。所以也需要考虑将将数据分在不同的机器上并行的进行计算,这样不仅可以节省大量的硬件的I/O开销,也能够将加快计算的速度。Hadoop对分布式计算的系统为MapReduce。Map即将数据分开存放进行计算,Reduce将分布计算的得到的结果进行整合,最后汇总得到一个最终的结果。这样对Hadoop的技术有一个清晰框架思路。
我们已经在千锋深圳大数据培训坚持了一段时间,很开心有一群志同道合的同学,有和蔼可亲的老师,生活很充实,制度也很严格很完善,虽然每天都在忙碌,感觉离自己的目标越来越近。在打造基础的阶段掌握好自己该掌握的,用好的姿态去面对接下来的学习。除了老师所授课的知识,我们还可以通过千锋深圳大数据培训网站上的hadoop学习视频去学习相关的知识。希望我们千锋深圳大数据培训班的同学们一起加油!
相关文章
06.29抢座
06.29抢座
06.29抢座
06.29抢座
06.08抢座
06.15抢座
筹备中抢座
06.15抢座
06.22抢座
了解千锋动态
关注千锋教育服务号
扫一扫快速进入
千锋移动端页面
扫码匿名提建议
直达CEO信箱