摘要: 本文是一份针对初学者介绍什么是大数据的笔记📒,涵盖了大数据的定义、特征、分类、应用与挑战、意义与发展趋势。笔记源自大数据学习实践课(中级),其中的配图来自:课程ppt或者当时听课自制的思维导图🍃每当面对专业迷茫时,大数据导论的大饼🫓总是让我遐想拥有改变世界的能力hhh…
一、大数据的定义
1.大数据(Big Data)
- 数据集合:
指无法在可承受的时间范围内,用常规软件工具进行捕捉、管理和处理的数据合集 - 信息资产:
是需要新处理模式,才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产
2.过程
- 《第三次浪潮》托夫勒
- 大数据应用 麦肯锡
- 《大数据时代》 舍恩伯格
- 云计算助力 谷歌
- 国内规模化 阿里云
3.为什么会有大数据
- 伴随着 云计算技术和 移动互联网技术的应用和发展
- 大数据称为新的生产要素,是重要的资产
资产:土地、劳动力、资金、数据
- 存储和计算技术的发展:分布式存储、分布式计算、弹性伸缩
4.大数据的发展历程
(a) 出现阶段 1980~2008年
- 1980-《第三次浪潮》首次提出大数据
- 2008-《自然》杂志在推出“大数据”专栏
(b) 热门阶段 2009~2011年
- 2011-麦肯锡正式定义了大数据
- 2011-十二五规划把信息处理技术作为关键提出来
(c) 特征阶段 2012~2016年
2012-《大数据时代》出版
2014-贵州提出“中国数谷”概念
2015-大数据上升成为国家战略
(d) 爆发阶段 2017~2022年
2017-全国至少有13个省成立数据管理机构
2018-达沃斯论坛把大数据作为重要议题
二、大数据的特征
1.体量大Volume
○ 根据IDC做出大估测,数据一直都在以每年50%的速度增长一倍
○ 人类在最近两年产出的数据量相当于之前产生的全部数据量
○ 人类生产的所有印刷材料的数据量是200PB
○ 历史上全人类说过的所有话的数量大约是5EB(1EB=1024PB)
○ 典型个人计算机硬盘的容量为TB量级
○ 一些大企业的数据量已经接近EB量级
2.种类繁多Variety
○ 10%为结构化数据,通常存储在数据库中
○ 90%为非结构化数据,格式多种多样
○ 场景:
3.价值密度低Value
○ 以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒,价值密度低,商业价值高
4.处理速度快Velocity
○ 从数据的生成到消费,时间窗口非常小,可用于生成决策的时间非常少
○ 最高峰值订单54.4万笔/秒
○ 单日处理数据量达到970PB
三、大数据的分类
1.大数据
2.数据
四、大数据的应用与挑战
1.大数据应用领域
领域广泛、形式多样:交通、政府、电商、金融、制造、教育、医疗、跨行业、能源
2.大数据应用场景举例
○ 商业
🌰:
○ 工业
🌰:
○ 医疗
🌰:
○ 城市治理
🌰:
3.大数据挑战
○ 数据
○ 数据资产管理
- “数据资产”概念已经广泛认可,但如何管理数据资产仍然缺少成熟理论以及工具手段
- 数据资产
五、大数据的意义与发展趋势
1.大数据的意义
○ 商业的变革
○ 管理的变革
○ 思维的变革
2.大数据的发展趋势
○ 我国大数据产业规模稳步增长
○ 政策热度持续攀升
○ 融合提速,不均衡现象突出
○ 创新与升级
🌿至此大数据分析概述笔记📒就介绍完啦~
-------------本文结束感谢您的阅读-------------
本文链接: http://example.com/2023/05/12/什么是大数据/
版权声明: 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。转载请注明出处!