第一章习题集答案

快捷查找:Ctrl+F   在搜索框中输入题目

一. 单选题(共3题)

1. (单选题)下面哪个不是Spark 的四大组件

A. Spark Streaming

B. park R

C. Graphx

D. Mlib

正确答案: B:park R ;

2. (单选题)Spark 哪个模式利用的Hadoop 的资源管理器

A. Spark on local

B. spark on YARN

C. spark on mesos

D. standalone

正确答案: B:spark on YARN ;

3. (单选题)Stage 的 Task 的数量由什么决定

A. TaskScheduler

B. Job

C. Partition

D. Stage

正确答案: C:Partition ;

二. 多选题(共6题)

4. (多选题)Spark的四大特点有什么

A. 支持多种资源管理器

B. 简单

C. 易用

D. 迅速

E. 通用

正确答案: ACDE:支持多种资源管理器 ; 易用 ; 迅速; 通用;

5. (多选题)Spark与Hadoop的区别为

A. 解决问题方式不同

B.  特点不同

C. 应用场景不同

D. 两者可合可分

正确答案: AD:解决问题方式不同 ; 两者可合可分 ;

6. (多选题)Spark Core包括什么

A. Spark SQL

B. Hash

C. SparkContext

D. Mllib

正确答案: AD:Spark SQL ; Mllib ;

7. (多选题)Spark特点包括

A. 稳健

B. 大量

C. 迅速

D. 易用

正确答案: CD:迅速 ; 易用 ;

8. (多选题)Spark的架构包括

A. Cluster Manager

B. Executor

C. Worker

D. Driver App

正确答案: ABCD:Cluster Manager ; Executor ; Worker ; Driver App ;

9. (多选题)Spark2.X新特征简单讲述三方面,分别为

A. 智能优化

B. 精简的API

C. Spark Core 的优化

D. Spark作为编译器

正确答案: ABD:智能优化 ; 精简的API ; Spark作为编译器 ;

三. 判断题(共14题)

10. (判断题) Spark可以非常方便地与其他的开源产品进行融合。

A. 对

B. 错

正确答案: 对

11. (判断题)Spark SQL是Spark用来操作非结构化数据的组件

A. 对

B. 错

正确答案: 错

12. (判断题)Spark支持多种资源管理器。

A. 对

B. 错

正确答案: 对

13. (判断题)Spark在2010年由Matei Zaharia在加州大学伯克利分校的AMPLab

A. 对

B. 错

正确答案: 错

14. (判断题)Spark则是一个专门的,用来对那些分布式存储的大数据进行处理的工具,它会进行分布式数据的存储。

A. 对

B. 错

正确答案: 错

15. (判断题)MLlib是Spark提供的一个机器学习算法库。

A. 对

B. 错

正确答案: 对

16. (判断题)Spark要比Hadoop快 10x-100x。

A. 对

B. 错

正确答案: 错

17. (判断题)Spark是基于内存的技术。

A. 对

B. 错

正确答案: 错

18. (判断题) Spark能够帮助我们处理那些需要处理大量实时或压缩数据的计算密集型的任务和挑战。

A. 对

B. 错

正确答案: 对

19. (判断题)Spark 2.0搭载了第二代Tungsten引擎。

A. 对

B. 错

正确答案: 对

20. (判断题)Spark的存在将代替Hadoop。

A. 对

B. 错

正确答案: 错

21. (判断题)Spark的构架设计,它分为4个组成部分,分别为Cluster Manager、Worker、Executor、Driver API。

A. 对

B. 错

正确答案: 错

22. (判断题)MapReduce上的不同作业在同一个节点运行时,会各自启动一个JVM(Java虚拟机)。而Spark同一节点的所有任务都可以在一个JVM上运行。

A. 对

B. 错

正确答案: 对

23. (判断题)Spark Core提供Spark最基础与最核心的功能,它的子框架包括Spark SQL,Spark Streaming,MLlib和GraphX。

A. 对

B. 错

正确答案: 对