发布网友 发布时间:2022-03-24 01:33
共1个回答
热心网友 时间:2022-03-24 03:03
数据中包含很多噪声数据,需要去除不相关的数据,比如如分析无关的字段
了解数据质量,有些数据质量不足以直接使用,如包含过多的缺失值,需要进行缺失值处理
数据字段不能够直接使用,需要派生新的字段,以更好的进行进一步的数据挖掘
数据分散,需要将数据进行整合,例如追加表(增加行),或者合并表(增加列)
通过数据的预处理能够很好的对数据有初步的认识和理解。
数据预处理推荐你一个数据挖掘软件:SmartMining桌面版,它和SPSS modeler 一样都是面板操作,预处理能力和计算能力都非常不错