本文关注数据整理过程中的重复数据和特殊数据的处理。
首先来看重复数据的判断与处理,这里使用一些简单的测试数据,如下图所示。
查找单列的重复数据时,首先可以对数据列进行排序,这样相同的数据就会排列到一起,如果数据量不大,重复数据就会一目了然,如上图中的数据,可以选中f1列中的一个数据单元格,然后通过“开始”选项卡>>“编辑”组>>“排序和筛选”>>“升序”对f1列中的数据升序排列,结果如下图所示,可以看到数据中有两个100。
当然,如果数据量较大,或者重复数据的位置不直观,可能并不容易直接观察到重复数据;此时,可以在排序后使用颜色标识重复数据。首先选中需要标识重复值的列,然后通过“开始”选项卡>>“样式”组>>“条件格式”>>“重复值”打开重复数据显示设置,如下图所示。
如果没有特殊要求使用默认的设置即可,点击“确定”后可以看到f1为100的两个值已经显示为浅红色背景和深红色字体,如下图所示。
标识重复数据操作还可同时操作多列,如选择f1、f2、f3列,然后通过“开始”选项卡>>“样式”组>>“条件格式”>>“重复值”标识重复数据,可以看到f1和f2中都标识了相同的数据,而f3没有相同的数据,如下图所示。
通过对重复数据的标识可以观察到f1、f2列的数据都重复了,而f3列的数据是不同的,由此可以判断,这两条记录可能并不是真的重复,而是f1和f2列的数据有误,此时就需要从数据的源头确认。当然,如果真的没有办法确认原始数据,也可以根据需要删除重复的数据记录。
删除重复数据时,可以通过“数据”选项卡>>“数据工具”组>>“删除重复值”操作,点击后会打开设置窗口,如下图所示。
此外,在高级筛选选项中还有“选择不重复的记录”,同样可以过滤重复数据,如下图所示。
判断数据是否正确,需要根据数据产生的场景来处理,而在整理数据时还会有一些特殊情况需要处理,如空白单元格,需要确认是否真的没有数据、是否需要默认数据等。
确定某一列的空白单元格时,可以对此列数据进行排序,排序后空白单元格会排列在一起,然后就可以根据需要进行处理,如设置默认值等。输入新值时,可以在选中所有空白单元格后直接输入数据,然后使用键盘Ctrl+Enter组合键完成操作。
需要查找数据区域内的所有空白单元格时,可以使用“定位”功能选中空白单元格,首先选择需要操作的数据区域,然后通过“开始”选项卡>>“编辑”组>>“查找和选择”>>“定位条件”打开定位条件设置窗口,并选中“空值”,如下图所示。
点击“确定”按钮后会选中数据区域中所有的空白单元格,需要设置数据时可以直接输入数据,最后使用键盘Ctrl+Enter组合键完成操作。
此外,需要对某一数据批量修改时还可以使用“替换”功能,首先还是选中数据区域,然后通过键盘Ctrl+H组合键打开“查找和替换”窗口,然后可以根据需要对原有数据进行修改,如下图所示。
窗口中需要输入“查找内容”(旧的数据)和“替换为”(新的数据),最后点击“全部替换”按钮完成操作。