- 为什么Spark比MapReduce快?

Spark是基于内存的,而MapReduce是基于磁盘的迭代

MapReduce的设设计:中间结果保存在文件中,提高了可靠性,减少了内存占用。但是牺牲了性能。
Spark的设计:数据在内存中进行交换,要快一些,但是内存这个东西,可靠性不如磁盘。所以性能方面比MapReduce要好。
DAG计算模型在迭代计算上还是比MapReduce的效率更高

有向无环图是指:一个图从顶点出发,无法再回到原点,那么这种图叫做有向无环图。

DAG计算模型在spark任务调度

Spark比MapReduce快的根本原因在于DAG计算模型,一般而言,DAG比MapReduce在大多数情况下可以减少shuffle次数,spark的DAG相当于一个改进版的MapReduce,如果计算不涉及其他节点进行数据交换,spark可以在内存中一次性完成这些操作,也就是中间结果无需落地磁盘,减少了磁盘IO的操作。但是,如果计算过程中涉及到计算交换,Spark也会把shuffle的数据写磁盘。

Spark比MapReduce快的主要原因是spark将反复用到的数据cache到内存中,减少数据加载耗时。

Spark是粗粒度资源调度,MapReduce是细粒度资源调度

总而言之Spark之所以比MapReduce快的原因是:

1:基于内存计算,减少抵消的磁盘交互
2:高效的调度算法,基于DAG
3:容错机制Linage,精华部分就是DAG和Linage

图片:

spark有mapreduce阶段嘛 spark相比mapreduce的优势_spark

带尺寸的图片:

spark有mapreduce阶段嘛 spark相比mapreduce的优势_流程图_02

居中的图片:

spark有mapreduce阶段嘛 spark相比mapreduce的优势_HTML_03

居中并且带尺寸的图片:

spark有mapreduce阶段嘛 spark相比mapreduce的优势_spark_04

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
  • 项目
  • 项目
  1. 项目1
  2. 项目2
  3. 项目3


创建一个表格

一个简单的表格是这么创建的:

项目

Value

电脑

$1600

手机

$12

导管

$1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列

第二列

第三列

第一列文本居中

第二列文本居右

第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPE

ASCII

HTML

Single backticks

'Isn't this fun?'

‘Isn’t this fun?’

Quotes

"Isn't this fun?"

“Isn’t this fun?”

Dashes

-- is en-dash, --- is em-dash

– is en-dash, — is em-dash

创建一个自定义列表


HTML Authors John Luke

如何创建一个注脚

一个具有注脚的文本。1

注释也是必不可少的

Markdown将文本转换为 HTML。

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 spark有mapreduce阶段嘛 spark相比mapreduce的优势_spark_05

spark有mapreduce阶段嘛 spark相比mapreduce的优势_流程图_06

你可以找到更多关于的信息 LaTeX 数学表达式here.

新的甘特图功能,丰富你的文章


Mon 06 Mon 13 Mon 20 已完成 进行中 计划一 计划二 现有任务 Adding GANTT diagram functionality to mermaid


  • 关于 甘特图 语法,参考 这儿,

UML 图表

可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图::


张三 李四 王五 你好!李四, 最近怎么样? 你最近怎么样,王五? 我很好,谢谢! 我很好,谢谢! 李四想了很长时间, 文字太长了 不适合放在一行. 打量着王五... 很好... 王五, 你怎么样? 张三 李四 王五


这将产生一个流程图。:


链接




长方形

圆角长方形

菱形


  • 关于 Mermaid 语法,参考 这儿,

FLowchart流程图

我们依旧会支持flowchart的流程图:


Created with Raphaël 2.2.0 开始 我的操作 确认? 结束 yes no


  • 关于 Flowchart流程图 语法,参考 这儿.

导出与导入

导出

如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

导入

如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。


  1. 注脚的解释 ↩︎