手把手教你:搭建Data Science环境_Java

关于数据科学,我们在多年之前就开始了解,一般在数据科学的工作当中包含如下几方面的工作:归纳问题、准备数据、模型训练与调整、生成报告与产品。说到数据科学平台的搭建,往往比较繁琐与费时,因为涉及到多个产品与平台,如果其中一环出现问题,那么这个平台就无法工作。并且在搭建平台的过程中涉及到多个开源的产品,而某些开源产品的文档不全面,在网络上也很难找到相应的troubleshooting材料,一旦遇到问题,真的是非常头痛。

数据科学家们一直想拥有这样一套平台,比如将Oracle这样强大的数据库与多种开源技术融合起来,无需复杂的配置就能使用熟悉的语言或者编程方法快速进行数据探索。最近,多家公有云提供商都推出了自己的数据科学平台,今天我们就手把手教您无需使用命令行如何快速在Oracle公有云上搭建数据科学平台。

第一步:登录Oracle公有云,创建compartments

手把手教你:搭建Data Science环境_Java_02

进入compartments页面之后,选择创建compartment

手把手教你:搭建Data Science环境_Java_03

给出compartment的名字、描述,并且选择root compartment作为这个compartment的parent,如下图所示。

手把手教你:搭建Data Science环境_Java_04

第二步:创建Group并添加成员

在控制台当中,来到Identity,然后点击Group链接,创建Group

手把手教你:搭建Data Science环境_Java_05

给出Group的名字和描述,然后点击创建按钮。

手把手教你:搭建Data Science环境_Java_06

接下来,我们为刚刚创建的Group添加成员。

手把手教你:搭建Data Science环境_Java_07

手把手教你:搭建Data Science环境_Java_08

通过下拉菜单选择用户,并添加。如果您想使用新的用户,请在identity当中通过User选项添加新的用户。

手把手教你:搭建Data Science环境_Java_09

第三步:创建并配置VCN

手把手教你:搭建Data Science环境_Java_10

在左侧选择我们刚刚创建好的compartment,然后点击创建按钮。

手把手教你:搭建Data Science环境_Java_11

手把手教你:搭建Data Science环境_Java_12

根据页面提示,给出VCN的名字、描述以及配置网络参数。关于网络参数,大家可以参考docs.oracle.com当中针对VCN的描述。

手把手教你:搭建Data Science环境_Java_13

手把手教你:搭建Data Science环境_Java_14

手把手教你:搭建Data Science环境_Java_15

VCN创建之后,会自动生成两个subnet,我们可以编辑当中public的subnet,并添加相关的访问策略。

手把手教你:搭建Data Science环境_Java_16

点击下方红色框区域,编辑安全列表

手把手教你:搭建Data Science环境_Java_17

添加ingress规则

手把手教你:搭建Data Science环境_Java_18

手把手教你:搭建Data Science环境_Java_19

第四步:创建Policy

来到identity,然后选择Policy

手把手教你:搭建Data Science环境_Java_20

在左侧选择刚才创建的compartment,然后点击创建policy按钮。

手把手教你:搭建Data Science环境_Java_21

请注意下方的policy statements,这里需要修改的是两部分内容,一个是group的名字,一个是compartment的名字。格式如下:

allow group 用户组名字 to manage data-science-family in compartment compartment名字

手把手教你:搭建Data Science环境_Java_22

接下来创建第二个policy,格式如下:

allow group 用户组名字 to use virtual-network-family in compartment名字

手把手教你:搭建Data Science环境_Java_23

创建第三个policy,格式如下:

allow service datascience to use virtual-network-family in compartment compartment名字

手把手教你:搭建Data Science环境_Java_24

第五步:创建Data Science项目

手把手教你:搭建Data Science环境_Java_25

选择刚才创建好的compartment,然后点击创建按钮


手把手教你:搭建Data Science环境_Java_26手把手教你:搭建Data Science环境_Java_27

创建notebook

手把手教你:搭建Data Science环境_Java_28

选择notebook所使用的虚拟机型号,并指定存储空间大小,比如我们下方给定存储空间为50GB。同时要指定网络配置。

手把手教你:搭建Data Science环境_Java_29

手把手教你:搭建Data Science环境_Java_30

第六步:使用notebook

比如我们进入Python编辑环境,写一条语句测试一下。手把手教你:搭建Data Science环境_Java_31


如果可以看到下面的结果,就说明当前平台搭建完毕,大家可以使用了。

手把手教你:搭建Data Science环境_Java_32

我们会在后续的文章中继续向大家介绍Data Science的相关内容,期待您的关注,谢谢。