都说现在是大数据时代。这是什么意思?

大数据(Megadata),或称巨量数据,是指海量、高增长、多样化的信息资产,需要新的处理模式,以具备更强的决策、洞察和流程优化能力。

“大数据”是指以多种形式从许多来源收集的庞大数据集,往往是实时的。在企业对企业销售的情况下,这些数据可以从社交网络、电子商务网站、客户访问记录和许多其他来源获得。这些数据不是公司客户关系管理数据库的正常数据集。

扩展数据

大数据的主要特征

1,很多

大数据的特点首先是“大”。从前Map3时代,一个小小的MB级Map3就能满足很多人的需求。但是随着时间的推移,存储单位从过去的GB变成了TB。

甚至现在的PB和EB水平。随着信息技术的飞速发展,数据开始爆炸式增长。社交网络(微博、推特、脸书)、移动网络、各种智能工具、服务工具等。都成为了数据的来源。

2.多样性

广泛的数据来源决定了大数据形式的多样性。任何形式的数据都可以发挥作用。目前应用最广泛的推荐系统有淘宝、网易云音乐、今日头条等。这些平台会通过分析用户的日志数据,进一步推荐用户喜欢的东西。

日志数据明显是结构化数据,有些数据没有明显的结构化,比如图片、音频、视频等。这些数据因果关系弱,需要人工标注。

3.高速的

大数据的产生非常迅速,主要是通过互联网传递。生活中的每一个人都离不开互联网,这意味着每一天,个人每天都在向大数据提供大量的信息。

而这些数据需要及时处理,因为花大量的资本去存储效果甚微的历史数据是非常不划算的。对于一个平台来说,保存的数据可能只是过去几天或者一个月的数据,距离很远的数据一定要及时清理,否则代价太高。

4.价值

这也是大数据的核心特征。在现实世界产生的数据中,有价值的数据比例非常小。与传统的小数据相比,大数据最大的价值在于从大量不相关类型的数据中学习。

挖掘出对未来趋势和模式的预测和分析有价值的数据,通过机器学习方法、人工智能方法或数据挖掘方法的深入分析,发现新的规律和新的知识,并应用于农业、金融、医疗等领域,最终达到改善社会治理、提高生产效率、促进科学研究的效果。

百度百科-大数据时代