都说现在是大数据时代。这是什么意思?
“大数据”是指以多种形式从许多来源收集的庞大数据集,往往是实时的。在企业对企业销售的情况下,这些数据可以从社交网络、电子商务网站、客户访问记录和许多其他来源获得。这些数据不是公司客户关系管理数据库的正常数据集。
扩展数据
大数据的主要特征
1,很多
大数据的特点首先是“大”。从前Map3时代,一个小小的MB级Map3就能满足很多人的需求。但是随着时间的推移,存储单位从过去的GB变成了TB。
甚至现在的PB和EB水平。随着信息技术的飞速发展,数据开始爆炸式增长。社交网络(微博、推特、脸书)、移动网络、各种智能工具、服务工具等。都成为了数据的来源。
2.多样性
广泛的数据来源决定了大数据形式的多样性。任何形式的数据都可以发挥作用。目前应用最广泛的推荐系统有淘宝、网易云音乐、今日头条等。这些平台会通过分析用户的日志数据,进一步推荐用户喜欢的东西。
日志数据明显是结构化数据,有些数据没有明显的结构化,比如图片、音频、视频等。这些数据因果关系弱,需要人工标注。
3.高速的
大数据的产生非常迅速,主要是通过互联网传递。生活中的每一个人都离不开互联网,这意味着每一天,个人每天都在向大数据提供大量的信息。
而这些数据需要及时处理,因为花大量的资本去存储效果甚微的历史数据是非常不划算的。对于一个平台来说,保存的数据可能只是过去几天或者一个月的数据,距离很远的数据一定要及时清理,否则代价太高。
4.价值
这也是大数据的核心特征。在现实世界产生的数据中,有价值的数据比例非常小。与传统的小数据相比,大数据最大的价值在于从大量不相关类型的数据中学习。
挖掘出对未来趋势和模式的预测和分析有价值的数据,通过机器学习方法、人工智能方法或数据挖掘方法的深入分析,发现新的规律和新的知识,并应用于农业、金融、医疗等领域,最终达到改善社会治理、提高生产效率、促进科学研究的效果。
百度百科-大数据时代