**结束了。**这个问题离题了。它目前不接受答案。**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
8年前关门了。改进这个问题所以我们很多人都在谈论大数据问题。我知道一些应用,比如网页排名,k-means和其他机器学习算法,还有网页索引等等。有人知道其他类型的大数据应用程序吗。
j0pj023g1#
这是一个集体智慧的时代。每天,我们创建大约25亿字节的数据。据估计,目前世界上90%的数据都是在过去两年内产生的。这就是我们生成数据的速度!这些数据的新来源与日俱增。这些数据来自于我们每个人每天离开无数次的网上足迹,用于收集气候信息的各种传感器,我们在社交媒体网站上的帖子,我们的数字图片和视频,短信,网上买卖交易记录,手机gps信号,每天的新闻报道为数百万部手机提供服务。这个数据是大数据。但如果我们用纯粹的技术术语:当使用传统的数据库管理工具来存储、搜索、分析、共享给定数量的数据变得困难时,这个庞大而复杂的数据集被称为bigdata。工业界很快就意识到了数据挖掘的潜力。因此,处理或分析一个组合的巨大数据集而不是单独的各种较小的数据集必然会提供更多的见解/趋势/模式。例如,根据出租汽车公司出租汽车预订的历史数据,可以很有可能地预测出租汽车应该停在城市的什么地方、哪种类型的出租汽车以及一天中什么时候出租!大数据很难用传统的处理方法来处理。它可能需要运行在数十台、数百台甚至数千台服务器上的大规模并行软件。对于像谷歌和苹果这样的大型企业来说,建立这样的服务器集群可能是可行的,但对于小型企业来说则不然。但是,随着商品硬件、云架构和社区驱动的开源软件的发展,大数据处理也进入了小数据处理领域。bigdata处理对初创公司来说也越来越可行,他们可以在云端租用服务器时间,而不是建造自己的服务器机房。大数据的发展每天都在影响着我们!无论是facebook上的“好友建议”还是谷歌上的“个性化广告”。业界正在不断挖掘数据(实际上是大数据),以提供高度个性化的用户体验,同时创造一种新的广告业务,在这种业务中,广告商事先知道您需要购买什么!好了,很多大数据的实际例子。来源:bigdataspeak
1条答案
按热度按时间j0pj023g1#
这是一个集体智慧的时代。每天,我们创建大约25亿字节的数据。据估计,目前世界上90%的数据都是在过去两年内产生的。这就是我们生成数据的速度!这些数据的新来源与日俱增。
这些数据来自于我们每个人每天离开无数次的网上足迹,用于收集气候信息的各种传感器,我们在社交媒体网站上的帖子,我们的数字图片和视频,短信,网上买卖交易记录,手机gps信号,每天的新闻报道为数百万部手机提供服务。这个数据是大数据。
但如果我们用纯粹的技术术语:
当使用传统的数据库管理工具来存储、搜索、分析、共享给定数量的数据变得困难时,这个庞大而复杂的数据集被称为bigdata。
工业界很快就意识到了数据挖掘的潜力。因此,处理或分析一个组合的巨大数据集而不是单独的各种较小的数据集必然会提供更多的见解/趋势/模式。例如,根据出租汽车公司出租汽车预订的历史数据,可以很有可能地预测出租汽车应该停在城市的什么地方、哪种类型的出租汽车以及一天中什么时候出租!
大数据很难用传统的处理方法来处理。它可能需要运行在数十台、数百台甚至数千台服务器上的大规模并行软件。对于像谷歌和苹果这样的大型企业来说,建立这样的服务器集群可能是可行的,但对于小型企业来说则不然。但是,随着商品硬件、云架构和社区驱动的开源软件的发展,大数据处理也进入了小数据处理领域。bigdata处理对初创公司来说也越来越可行,他们可以在云端租用服务器时间,而不是建造自己的服务器机房。
大数据的发展每天都在影响着我们!无论是facebook上的“好友建议”还是谷歌上的“个性化广告”。业界正在不断挖掘数据(实际上是大数据),以提供高度个性化的用户体验,同时创造一种新的广告业务,在这种业务中,广告商事先知道您需要购买什么!
好了,很多大数据的实际例子。
来源:bigdataspeak