就是从大量的数据中,提取隐藏在其中的,事先不知道的、但潜在有用的信息的过程。数据挖掘的目标是建立一个决策模型,根据过去的行动数据来预测未来的行为。比如分析一家公司的不同用户对公司产品的购买情况,进而分析出哪一类客户会对公司的产品有兴趣。在讲究实时、竞争激烈的网络时代,若能事先破解消费者的行为模式,将是公司获利的关键因素之一。数据挖掘是一门交叉学科,它涉及了数据库,人工智能,统计学,可视化等不同的学科和领域。
下载贤集网APP入驻自媒体
在大数据准确营销和大数据洞察力等一系列热门词汇的背后,数据挖掘和分析技术在各行业发挥着重要作用,随着数据资源的爆炸性增长,数据挖掘技术不仅成为政府部门提高治理能力的重要手段,而且成为提升各行业核心竞争力的关键。 一、数据挖掘的定义 数据挖掘(Data Mining)是指通过大量数据集进行分类的自动化过程,以通过数据分析来识别趋势和模式,建立关系来解决业务问题。换句话说,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。 二、数据挖掘与数据分析的区别 数据分析和数据挖掘都是从数据库中发现知识,但却有所不同。数据分析主要通过统计、计算、抽样等相关的方法,来获取基于数据库的数据表象的知识。数据挖掘则主要通过机器学习或者是通过数学算法等相关的方法获取深层次的知识(比如属性之间的规律性,或者是预测)。简单来说,数据分析是把数据变成信息的工具,而数据挖掘是把信息变成认知的工具,可以将数据分析得出的信息转化为有效的预测和决策。