关于数据科学,我们在多年之前就开始了解,一般在数据科学的工作当中包含如下几方面的工作:归纳问题、准备数据、模型训练与调整、生成报告与产品。说到数据科学平台的搭建,往往比较繁琐与费时,因为涉及到多个产品与平台,如果其中一环出现问题,那么这个平台就无法工作。并且在搭建平台的过程中涉及到多个开源的产品,而某些开源产品的文档不全面,在网络上也很难找到相应的troubleshooting材料,一旦遇到问题,真的是非常头痛。
数据科学家们一直想拥有这样一套平台,比如将Oracle这样强大的数据库与多种开源技术融合起来,无需复杂的配置就能使用熟悉的语言或者编程方法快速进行数据探索。最近,多家公有云提供商都推出了自己的数据科学平台,今天我们就手把手教您无需使用命令行如何快速在Oracle公有云上搭建数据科学平台。
第一步:登录Oracle公有云,创建compartments
进入compartments页面之后,选择创建compartment
给出compartment的名字、描述,并且选择root compartment作为这个compartment的parent,如下图所示。
第二步:创建Group并添加成员
在控制台当中,来到Identity,然后点击Group链接,创建Group
给出Group的名字和描述,然后点击创建按钮。
接下来,我们为刚刚创建的Group添加成员。
通过下拉菜单选择用户,并添加。如果您想使用新的用户,请在identity当中通过User选项添加新的用户。
第三步:创建并配置VCN
在左侧选择我们刚刚创建好的compartment,然后点击创建按钮。
根据页面提示,给出VCN的名字、描述以及配置网络参数。关于网络参数,大家可以参考docs.oracle.com当中针对VCN的描述。
VCN创建之后,会自动生成两个subnet,我们可以编辑当中public的subnet,并添加相关的访问策略。
点击下方红色框区域,编辑安全列表
添加ingress规则
第四步:创建Policy
来到identity,然后选择Policy
在左侧选择刚才创建的compartment,然后点击创建policy按钮。
请注意下方的policy statements,这里需要修改的是两部分内容,一个是group的名字,一个是compartment的名字。格式如下:
allow group 用户组名字 to manage data-science-family in compartment compartment名字
接下来创建第二个policy,格式如下:
allow group 用户组名字 to use virtual-network-family in compartment名字
创建第三个policy,格式如下:
allow service datascience to use virtual-network-family in compartment compartment名字
第五步:创建Data Science项目
选择刚才创建好的compartment,然后点击创建按钮
创建notebook
选择notebook所使用的虚拟机型号,并指定存储空间大小,比如我们下方给定存储空间为50GB。同时要指定网络配置。
第六步:使用notebook
比如我们进入Python编辑环境,写一条语句测试一下。
如果可以看到下面的结果,就说明当前平台搭建完毕,大家可以使用了。
我们会在后续的文章中继续向大家介绍Data Science的相关内容,期待您的关注,谢谢。