前两天帮市场部的老张整理客户名单,他跟我说:“这表有八千多行,重复的怕是占了三分之一,我手动删了俩小时,眼睛都快瞎了。”我瞅了一眼,好家伙,名字、电话、地址全一样,连备注里的“已回访”都复制得一模一样。这种事儿我见得太多了,真没必要手动删,Excel里头藏着个**一键去重**的神器,你只要会用,三分钟搞定。
先别急着点菜单,操作前得做点小准备。你得确认你要去重的列是哪几列,比如你只想根据“手机号”去重,那其他列哪怕不一样也别管;要是你想让“姓名+电话+地址”三者全一致才算重复,那就得全选上。很多人在这儿栽跟头,选错列了,结果把不同客户当成重复删了,哭都来不及。**选对关键列,是去重成败的第一道坎**。
选好列之后,选中整块数据区域,别只点一格,要拖到最后一行。然后点顶部菜单栏的“数据”——找到“删除重复项”,别看错成“条件格式”或者“高级筛选”,这两个玩意儿看着像,但压根不是一回事。点进去之后,弹窗里头会自动列出你选中的所有列,这时候你得一个个勾选,**别图省事全选或全不选**,尤其是你有“备注”“日期”这种容易变的字段,千万别勾,不然你删的不是重复,是正常数据。
我见过有人点完“确定”之后傻眼了,说怎么删得只剩两行?一问才知道,他把“订单编号”也勾上了,可每个订单编号本来就是唯一的,系统当然觉得每行都不同,结果一个没删。还有人删完发现电话号码丢了,原来他没选“电话”列,系统压根没管它,删的是别的字段。**去重是“按你选的列来判断”,不是按整行**,这点真得记牢。
操作完别急着关,先看左下角的状态栏,它会告诉你“删除了X个重复项,保留Y个唯一值”,心里就有底了。要是数字不对,赶紧Ctrl+Z撤回,重新检查选中的列。我有个同事去年搞活动发券,去重时漏了“优惠券编号”,结果同一个客户领了三张券,财务追着问了半个月。
有个小技巧你得知道,如果你的数据里头有空行、空单元格,Excel有时候会误判,觉得“空”和“空”是重复,结果把本该保留的行删了。所以去重前,先用Ctrl+G定位空值,把那些没填的补上“无”或者“待确认”,别留白。**数据干净,去重才准**,别嫌麻烦。
还有个隐藏用法:如果你的表有标题行,记得勾选“数据包含标题”,不然第一行标题会被当成数据参与去重,删了你整个表就废了。这个选项默认是勾着的,但万一你之前改过设置,它可能被关了,自己检查下。
去重完最好保存个副本,别直接覆盖原文件。我习惯另存为“客户名单_去重版.xlsx”,原文件留着当备份,万一哪天客户说“我上次填的是张三,怎么变成李四了”,你还能翻回去对。这年头,**数据无小事,备份是基本修养**。
你要是经常处理这种重复数据,可以顺手把“删除重复项”加到快速访问工具栏,以后点一下就行,不用每次翻“数据”菜单。右键那个按钮,选“添加到快速访问工具栏”,以后Ctrl+Shift+D都能呼出来,效率直接翻倍。
延伸一下,如果你的重复数据来自不同表格,比如从三个部门各自导出的名单,想合并去重,那就得先用“合并查询”功能,或者用Power Query,那玩意儿能自动识别字段对齐,还能保留源数据来源,适合进阶玩家。不过对新手来说,先把单表搞明白,再去碰多表联动,别一上来就硬刚。