应用场景
必备组件
- spark 下载
-
Apache Toree has one main goal: provide the foundation for interactive applications to connect and use Apache Spark.
- 下载地址
- 标注 :
安装命令
- 在线 install
- anaconda 环境变量已在Linux PATH环境变量中,没有则配置;或者切换至Anaconda bin目录下,利用pip命令安装、配置。
- 离线 install
- 下载 GitHub 源代码、tar包均可实现离线安装。
- 源代码安装
-
/root/anaconda2/bin/python setup.py install
-
jupyter toree install --spark_home=your-spark-home
测试代码
- 测试环境是否搭建成功
- 执行结果
扩展 : 安装多内核
- Installing Multiple Kernels
- Options
-
--interpreters=<Unicode> (ToreeInstall.interpreters)
Default: 'Scala'
A comma separated list of the interpreters to install. The names of the
interpreters are case sensitive.
References
- Jupyter Notebook通过toree配置PySpark开发环境及其工作原理. 推荐
- 基于pyspark 和scala spark的jupyter notebook 安装. 推荐
- Apache Spark in Python: Beginner’s Guide. 推荐
- toree-0.2.0.dev1.tar.gz
- Apache Toree
- hadoop-common-2.2.0-bin
FAQs