好房网

网站首页百科全书 >正文

数据预处理的四种方法(数据预处理的四种方式)

2022-07-07 16:12:48 百科全书来源:
导读1、数据预处理的四种方式2、数据预处理的四种方式是:3、1.数据清理。数据清理例程通过填充缺失值、平滑噪声数据、识别或删除异常值以及解...

1、数据预处理的四种方式

2、数据预处理的四种方式是:

3、1.数据清理。数据清理例程通过填充缺失值、平滑噪声数据、识别或删除异常值以及解决不一致问题来“清理”数据。主要实现了以下目标:格式标准化、异常数据剔除、纠错和重复数据剔除。

4、2.数据整合。数据集成例程组合来自多个数据源的数据,并以统一的方式存储它们。构建数据仓库的过程实际上就是数据集成。

5、3.数据转换。通过平滑聚合、数据泛化和标准化,将数据转换成适合数据挖掘的形式。

6、4.数据简化。在挖掘数据的时候,数据量非常大,少量的数据挖掘和分析需要很长的时间。利用数据约简技术可以得到数据集的约简表示,约简表示要小得多,但仍接近保持原始数据的完整性,结果与约简前相同或几乎相同。

7、数据预处理是指在主处理之前对数据的一些处理。主要任务是清理异常值,纠正错误数据。现实世界中的数据一般都是不完整、不一致的脏数据,无法直接挖掘,或者挖掘结果不尽如人意。为了提高数据挖掘的质量,数据预处理技术得到了发展。

本文到此结束,希望对大家有所帮助。


版权说明:本文由用户上传,如有侵权请联系删除!


标签:

热点推荐
热评文章
随机文章