加入收藏 | 设为首页 | 会员中心 | 我要投稿 济源站长网 (https://www.0391zz.cn/)- 数据工具、数据仓库、行业智能、CDN、运营!
当前位置: 首页 > 大数据 > 正文

数据分析与挖掘学习(一)

发布时间:2021-03-10 03:28:18 所属栏目:大数据 来源:网络整理
导读:数据分析与挖掘过程 一. 定义挖掘目标 一般的数据挖掘任务包括: 1. 分类与预测 2. 聚类分析 3. 关联规则 4. 时序模式 5. 偏差检验 6. 智能推荐 二. 数据取样 抽取一个与挖掘目标相关的样本子集,标准是 1. 相关性 2. 可靠性 3. 有效性 而不是选用全部数据做

数据分析与挖掘过程

一. 定义挖掘目标

一般的数据挖掘任务包括:
1. 分类与预测
2. 聚类分析
3. 关联规则
4. 时序模式
5. 偏差检验
6. 智能推荐

二. 数据取样

抽取一个与挖掘目标相关的样本子集,标准是
1. 相关性
2. 可靠性
3. 有效性
而不是选用全部数据做样本。
数据样本选取得好,还可以使我们要寻找的规律更加凸显出来

三. 数据探索

拿到样本数据集之后,开始进行数据探索,下面是一些探索的内容:
1. 项目中有没有什么明显的规律和趋势
2. 属性之间有什么相关性
3. 它们可以分成怎样一些类别
4. …
具体可能还包括下面的内容:
1. 异常值分析
2. 缺失值分析
3. 相关性分析
4. 周期性分析

四. 数据预处理

五. 挖掘建模

六. 模型评价

(编辑:济源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读