时间:2024-10-19 01:01:54
预处理包括哪些内容
数据预处理包括以下几个方面的内容:
1. 数据清理:通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要目标包括格式标准化、异常数据清除、错误纠正和重复数据的清除等。
2. 数据集成:将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程实际上就是数据集成。
3. 数据变换:通过平滑聚集、数据概化、规范化等方式将数据转换成适用于数据挖掘的形式。
4. 数据审核:包括准确性审核、适用性审核、及时性审核和一致性审核四个方面。
5. 数据筛选:对审核过程中发现的错误应尽可能予以纠正。
6. 数据排序:按照一定顺序将数据进行排列。
《预处理包括哪些内容》不代表本网站观点,如有侵权请联系我们删除
精彩推荐