当先锋百科网

首页 1 2 3 4 5 6 7
大数据 Big Data
描述大量数据或动态大数据(某一时点大量数据)的情况下的各种应对。1)网站前端大数据输入,引出高并发、高负载、高性能的处理;2)大数据后台处理,引出分布式处理、分布式存储、 云计算;3)大数据摆在面前,应该搞点数据分析,不用好像白不用,于是引出数据挖掘。

与数据挖掘的关系:大数据推手认为大数据的核心是预测,从而我们可以理解为数据挖掘是其核心。

题外话:当然,如果是大数据概念推手,你可以把“大量数据的情况下”改为“大数据时代下”~。


数据挖掘 Data Mining/DM
通过算法搜索隐藏信息,可助决策 Decition making 和预测 forecast。

应用 - 如:购物习惯、舆情分析、社交关系、市场调研、产品推荐、用户行为。
算法(广义) - 简单的如:频数统计、极值、均值;中等的如:数据立方体 Data Cube;复杂的如 机器学习算法:分类、回归、聚类(基于某些假设的统计模型)。
算法(狭义) - 等同于机器学习算法。
与BI的关系:商业智能(Business Intelligence,BI)把数据挖掘用到商业领域中。

题外话:数据太多,还要避免过拟合