乐胖代购免代理版

选手一号位

无所谓身份，只愿与你真诚相待！

2.4万 人气
18 原创
1 粉丝
1.2万 阅读数

关注

于 2017-11-21 加入 51CTO7.2年

感兴趣的领域

#Java #JavaScript #Mysql #HTML5 #jQuery #redis #微信开发 #Hadoop

精品课程

免费资料>

2024软考

高级中级初级

华为认证

数通云计算安全

厂商认证

K8s Oracle 红帽

IT技术

数据库网络安全 AIGC

Ta的分类

加载更多

近期来访

# Flink实时项目

11.Flink实时项目之支付宽表

支付宽表的目的，最主要的原因是支付表没有到订单明细，支付金额没有细分到商品上，没有办法统计商品级的支付状况。所以本次宽表的核心就是要把支付表的信息与订单明细关联上。

flink

实时数仓

原创精选 2022-04-17 11:50:58 439 阅读 1点赞私藏项目实操分享

Dockerfile入门

在之前Docker的使用中，我们直接从仓库下载需要的镜像到本地，然后稍加配置就可以应用了，通常从仓库下载下来的镜像都是通用的，无任何私有化的东西，我们拿过来就需要加很多的配置，每次使用就很麻烦。如果我们想定制化某一个镜像可以吗？比如Nginx，我不想每次使用都加很多的配置，而是定制化后，我再按照定制化的规则去使用，及时的安装部署我需要的Nginx环境。DockerFile就是做这个工作的，一个用基础镜像来构建新镜像的文本文件，里面包含构建镜像需要的各种指令。

docker

centos

原创 2022-04-05 23:33:54 160 阅读 yyds干货盘点

10.Flink实时项目之订单维度表关联

在上一篇中，我们已经把订单和订单明细表join完，本文将关联订单的其他维度数据，维度关联实际上就是在流中查询存储在 hbase 中的数据表。但是即使通过主键的方式查询，hbase 速度的查询也是不及流之间的 join。外部数据源的查询常常是流式计算的性能瓶颈，所以我们在查询hbase维度数据的基础上做一些优化及封装。

flink

订单宽表

原创推荐 2022-03-31 23:07:35 1826 阅读私藏项目实操分享

9.Flink实时项目之订单宽表

订单是统计分析的重要的对象，围绕订单有很多的维度统计需求，比如用户、地区、商品、品类、品牌等等。为了之后统计计算更加方便，减少大表之间的关联，所以在实时计算过程中将围绕订单的相关数据整合成为一张订单的宽表。那究竟哪些数据需要和订单整合在一起？

flink

大数据

原创 2022-03-17 23:19:00 1364 阅读 2评论 yyds干货盘点

8.Flink实时项目之CEP计算访客跳出

要想知道访客跳出明细，首先要识别哪些是跳出行为，要把这些跳出的访客最后一个访问的页面识别出来。那么就要抓住几个特征。

Flink CEP

原创 2022-03-09 23:14:25 257 阅读私藏项目实操分享

7.Flink实时项目之独立访客开发

在上6节当中，我们已经完成了从ods层到dwd层的转换，包括日志数据和业务数据，下面我们开始做dwm层的任务。 DWM 层主要服务 DWS，因为部分需求直接从 DWD 层到DWS 层中间会有一定的计算量，而且这部分计算的结果很有可能被多个 DWS 层主题复用，所以部分 DWD 会形成一层 DWM

kafka

flink

实时计算

原创 2022-03-05 23:25:42 888 阅读

6.Flink实时项目之业务数据分流

在上一篇文章中，我们已经获取到了业务数据的输出流，分别是dim层维度数据的输出流，及dwd层事实数据的输出流，接下来我们要做的就是把这些输出流分别再流向对应的数据介质中，dim层流向hbase中，dwd层依旧回写到kafka中。

kafka

flink

大数据

实时计算

原创 2022-02-22 00:07:43 655 阅读

5.Flink实时项目之业务数据准备

在上一篇文章中，我们已经把客户端的页面日志，启动日志，曝光日志分别发送到kafka对应的主题中。在本文中，我们将把业务数据也发送到对应的kafka主题中。通过maxwell采集业务数据变化，相当于是ods数据，把采集的数据发送到kafka的topic（ods_base_db_m）中，然后flink从kafka消费数据，这个过程有维度数据，就放到hbase中，其他事实数据再发送给kafka作为dwd层。flink消费kafka数据可以做一些简单的ETL处理，比如过滤空值，长度限制。

flink

kafka

实时计算

大数据

原创 2022-02-19 22:20:07 790 阅读

4.Flink实时项目之日志数据拆分

我们前面采集的日志数据已经保存到 Kafka 中，作为日志数据的 ODS 层，从 kafka 的ODS 层读取的日志数据分为 3 类, 页面日志、启动日志和曝光日志。这三类数据虽然都是用户行为数据，但是有着完全不一样的数据结构，所以要拆分处理。将拆分后的不同的日志写回 Kafka 不同主题中，作为日志 DWD 层。页面日志输出到主流，启动日志输出到启动侧输出流，曝光日志输出到曝光侧输出流

json

kafka

flink

原创 2022-02-14 23:05:12 835 阅读

3.Flink实时项目之流程分析及环境搭建

前面已经将日志数据（ods_base_log）及业务数据（ods_base_db_m）发送到kafka，作为ods层，接下来要做的就是通过flink消费kafka 的ods数据，进行简单的处理作为dwd层，然后再写回到kafka。

flink

大数据

原创 2022-02-10 23:25:53 1060 阅读

2.Flink实时项目之Maxwell介绍

Maxwell 是由美国 Zendesk 开源，用 Java 编写的 MySQL 实时抓取软件。实时读取 MySQL 二进制日志 Binlog，并生成 JSON 格式的消息，作为生产者发送给 Kafka，Kinesis、 RabbitMQ、Redis、Google Cloud Pub/Sub、文件或其它平台的应用程序。

kafka

flink

maxwell

主从复制

原创 2022-02-09 21:28:23 595 阅读

1.Flink实时项目之前期准备

Flink实时项目前期准备，包括日志生成项目，日志采集项目，实现将日志发送给kafak。

flink

nginx

java

kafka

原创 2022-02-09 21:20:54 718 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

选手一号位

11.Flink实时项目之支付宽表

Dockerfile入门

10.Flink实时项目之订单维度表关联

9.Flink实时项目之订单宽表

8.Flink实时项目之CEP计算访客跳出

7.Flink实时项目之独立访客开发

6.Flink实时项目之业务数据分流

5.Flink实时项目之业务数据准备

4.Flink实时项目之日志数据拆分

3.Flink实时项目之流程分析及环境搭建

2.Flink实时项目之Maxwell介绍

1.Flink实时项目之前期准备

欢迎