数合建模是可视化数据分析平台,既支各类政企人员自主可视化需求,也支持个人用户数据处理加工需求,如数据建模、创建和使用报表、大屏,进行可视化数据分析,构建可视化数据应用等,扩展功能还支持各种来源数据的接入汇聚、标准化、数据服务、服务管理等数据中台的功能

(一)数据管理

根据数据源端的数据情况,选择接入或导入,是数据建模的第一步 接入:适用于有一定数据量,且定期有更新的数据环境。一般通过ETL工具配置数据库进行数据的接入及更新,也可以通过接口调用完成数据接入。 导入:适用于数据量不大,且更新频率低的数据环境。比如临时导入一批数据进行分析,或者全量数据不大,分析周期比较固定的场景。 

数据建模功能_数据可视化

上图中所示为数合建模的数据管理模块,支持数据的上传、导出、删除、重新上传四类功能。重新上传是为了实现数据的追加或替换,但不影响已完成的数据模型而设计的。

数据接入会在后续数据治理专题进行分享,在此不再展开 

(二)数据建模

核心模块,完成数据预处理和业务建模。 预处理,完成代码表转换、数据格式转换(字符转数字等),统一格式,方便后面的业务建模。 业务建模,既支持数学模型的建立,也支持数据挖掘模型的建立。

数据建模功能_数据建模_02

数据建模功能包括新建模型、搜索模型、设为模型、共享模型、共享标签、删除模型、编辑模型。

数据建模功能_数据建模_03

新建模型操作窗口,数据节点下面的自有数据展示用户导入的数据信息,前面讲到的接入数据资源展示在公共数据窗口,供范围内用户使用。 

数据建模功能_数据建模_04

新建模型操作窗口,算子节点下面有两类算子:

一类数据处理算子,通过表联接、过滤等sql算子来实现数学模型的构建,目前集成了十几类sql算子,能够支撑上百种业务场景; 一类数据挖掘算子,通过数据挖掘算法来实现数据挖掘模型的构建(数学模型和数据挖掘模型请关注什么是数据建模),目前集成了K最近邻、广义线性模型、决策树等9种数据挖掘算子,相关业务场景比如经典尿布和啤酒、房价预测、银行客户流失等 

数据建模功能_数据可视化_05

模型示例,左边是模型结构图,右边是模型结果。订单详情,使用了3类数据,3种sql算子。

数据建模的结果是二维表格,二维表格展示的优势是基础指标或详细的业务分析结果,那么如果进一步发现多组分析之间的关系,并作用于业务指标的建立或完善,或者进行应用的发布,涉及到数据可视化的相关模块 

(三)数据可视化

在数合建模中,数据可视化通过看板组件和看板组合两个模块来完成 看板组件完成单个可视化模块的设计和发布,包括图表样式、数据、其他样式等。

数据建模功能_数据建模_06

数据建模功能_数据可视化_07

数据建模功能_数据建模_08

看板组合,对已经发布的看板组件按照主题或目标进行组合显示设置。包括标签、图标、边框等组件设置,以及组件位置、大小、背景等的设置。 

数据建模功能_数据建模_09