1. Hadoop平台概念及大致原理解释(掌握的小白忽略
    从狭义的角度上来讲,大数据就是比如某些数据十分庞大,比如按常理来说,我们个人使用的电脑只能存大约1个T的数据,如果数据达到了几十个ZB呢?显然一台电脑是存不下的,或者有人说哪增大电脑存储量呢?显然如果数据量一直增加下去,这种通过不断增加一台计算机的存储量是不合理的。而有没有什么比较好的办法?
    显然是有的,为什么不可以把这一个文件切分成多个小文件,(一般默认切分的文件大小有 64MB和128MB的,取决于你使用的是hadoop哪一个版本)然后将这些小文件分发到其他电脑上进行存储,当你用到文件中某些数据时,再从这些电脑上的把切分后的数据进行重组返回原来的数据进行查询呢?这就是我们的hadoop平台可以做到的事。Hadoop平台当中有一个组件是HDFS(分布式文件系统),它将一个文件切割成多个小的文件,然后分发到其他电脑上进行存储,哪如何管理这些文件分发呢,这得益于我们的hadoop的一个组件yarn,他对我们那些切分的数据块进行分发和管理,当然了这只是其中两个组件,Hadoop当中还有很多组件。此次搭建部分只讲这么多
  2. 相关软件解释
    我们需要的安装软件有VMware15,xftp4,xshell5以及相关镜像源(如centos7,ubuntu)
    我们需要从自己的电脑上进行模拟多态电脑,而vmware软件你可以把它想做是模拟我们电脑硬件的,电脑有了硬件可运行不起来,还需要相关软件去调用,比如我们使用的windos系统就是去调用电脑相关环境去工作,而准备的镜像源(如centos7,ubuntu)就是用来用作相关软件的镜像。而xshell5可理解是远程去管理你的电脑,可以远程去控制你的电脑(此处是指去向虚拟机里发送命令,远程控制你的虚拟机),xftp4是去向你的电脑发送文件的。
  3. 相关软件安装
    软件下载:链接:https://pan.baidu.com/s/1TcaFMZtGPwlUfbO0v29hyw
    提取码:1vcp
    复制这段内容后打开百斜体样式度网盘手机App,操作更方便哦

4**** 说明****

由于发表图片cnds上显示版权不明,我将其搭建过程发表在我的博客园上面,欢迎各位访问