为什么叫数据“湖”?-51CTO学堂-大数据帮助改善设计

为什么叫数据“湖”?

5079未经授权,禁止转载
大数据AWS数据湖非结构化数据数据仓库云存储服务数据挖掘机器学习数据安全数据治理实时数据处理
数据湖是在数据日益复杂化的背景下出现的新型数据管理架构,允许存储来自多种来源的结构化和非结构化数据。相比传统数据仓库,数据湖不要求预处理数据,能够保持数据的原始性,适应各类数据分析和处理需求。这种结构支持灵活的数据分析方法,如数据挖控和机器学习。数据湖通过利用成本较低的云存储服务,降低了存储成本,且因其弹性可以根据需求进行扩展和调整。使用数据湖可以增强组织的数据管理和分析能力,但同时也要注意数据的安全性、质量和治理问题。数据湖已被广泛应用于数据科学、实时数据处理等领域,提供了一个灵活的平台供数据科学家和分析师进行数据探索。
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
ad
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
讲师头像
陈涛
曾主持过数十个百万级以上的虚拟化、云计算、容灾及信息安全项目的建设,在政府、通信、金融、大型企业、保险、财政、电力、教育等各行业拥有深厚的经验和客户认可。 1997年开始在MCSE(微软认证工程师)、Linux、Oracle等认证培训机构任职,河南知名高端IT认证培训讲师。陈涛老师凭借理论体系结构严谨、课程内容丰富充实、案例贴近工作、讲授深入浅出感染力强、充分互动课堂实践的风格备受学员好评,到目前为止已培养微软、Linux、Oracle等认证高级工程师数千名。
TA的课程
接下来播放:
自动连播