看点:数据清洗的方法包括哪些_数据清洗是什么意思

互联网 2023-04-30 20:52:52


(资料图片)

1、数据清洗(Data cleaning)– 对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。

2、 数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。

3、因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏数据”。

4、我们要按照一定的规则把“脏数据”“洗掉”,这就是数据清洗。

5、而数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。

6、不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。

7、数据清洗是与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。

本文到此分享完毕,希望对大家有所帮助。

x

热门推荐

理文造纸(2314.HK)上半年纯利按年跌57% 每吨净利润达到292港元

2022-08

啤酒行业高端化发展趋势凸显 力推中高端产品

2022-07

疫情后营业额翻四倍 多家小店迎来复苏

2022-05

强化优环境“软实力 赣州经开区助力企业走好绿色发展之路

2022-05

又有一家公司追锂 索通发展进军锂电材料领域胜算几

2022-05

海南推动农贸市场全面落实禁塑 加强违禁塑料制品源头治理

2021-12

柴犬登登拍卖记:动物是如何被司法拍卖的

2021-12

江西:到2025年鄱阳湖区断面水质优良比例达到50%以上

2021-12

西藏森林消防:锻造雪域救援尖兵 打造高海拔山岳救援队伍

2021-12

加强人才融通发展 第10届海峡两岸水利青年工程交流营成功举办

2021-12

推荐阅读

看点:数据清洗的方法包括哪些_数据清洗是什么意思

2023-04

广东阿姨高烧多日不退!近期外出旅行要注意这种虫子

2023-04

HKIEF香港创新加密基金:预计数字港元采用两层式分发架构

2023-04

西安高新区一季度GDP增长10.5% 天天信息

2023-04

朝阳街道新县社区:参观学习拓思路 取长补短促提升_当前观察

2023-04

羽毛球明星海报_羽毛球明星 全球聚看点

2023-04

双舰合壁!中国海军再赴苏丹港完成第二批中外公民撤离 世界今亮点

2023-04

天天精选!ppt怎么制作小图标_用PPT怎么做各种小图标

2023-04

“最火”五一 挤爆的不只是淄博具体详细内容是什么 世界今日报

2023-04

当前要闻:生意社:焦亚硫酸钠行情周报(4.24-4.30)

2023-04