数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、机器学习、模式识别等诸多方法来实现上述目标。
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。
建议了解内容:
非负矩阵分解(Algorithm, Initialization, and Convergence for the Nonnegative Matrix Factorization)
聚类算法(聚类算法综述等)
主成分分析(A Tutorial on Principal Component Analysis)等…