找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 24422|回复: 5

[文本处理] 批处理获取重复行(只保留一次)

[复制链接]
发表于 2015-1-6 21:40:25 | 显示全部楼层 |阅读模式
a.txt内容如下:
123
456
789
123
123
789

获取重复的行,并且重复的行只保留一次,处理后得到b.txt内容如下:
123
789

方法1:
  1. @echo off
  2. REM 缺点1:无法处理特别大的文件
  3. REM 缺点2:需要使用文件中没有出现的字符来标记变量(本例中使用的是下划线)
  4. setlocal
  5. for /f "delims=" %%i in (a.txt) do (
  6.     set /a _%%i+=1
  7. )
  8. (for /f "tokens=1-2 delims=_=" %%i in ('set _') do (
  9.     if %%j gtr 1 (
  10.         echo,%%i
  11.     )
  12. ))>b.txt
  13. endlocal
复制代码
方法2:
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. set "PriLine="
  4. set "DupNum=1"
  5. (for /f "delims=" %%i in ('sort a.txt') do (
  6.     if "!PriLine!" equ "%%i" (
  7.         set /a DupNum+=1
  8.     ) else (
  9.         if !DupNum! gtr 1 (
  10.             echo,!PriLine!
  11.         )
  12.         set DupNum=1
  13.     )
  14.     set "PriLine=%%i"
  15. ))>b.txt
  16. if !DupNum! gtr 1 (
  17.     >>b.txt echo,!PriLine!
  18. )
复制代码
方法3:
  1. gawk "{a[$0]++}END{for(i in a)if(a[i]>1)print i}" a.txt > b.txt
复制代码
发表于 2015-1-6 21:42:32 | 显示全部楼层
谢谢,确实在找它。
发表于 2015-8-13 23:03:59 | 显示全部楼层
不错不错不错不错不错
发表于 2015-8-13 23:04:28 | 显示全部楼层
不错不错不错不错不错
发表于 2015-8-13 23:11:02 | 显示全部楼层
回复 4# MCRGZN


    呃,请不要无意义回帖,刷分到此为止
发表于 2015-8-15 17:21:48 | 显示全部楼层
  1. gawk "a[$0]++" a.txt>b.txt
复制代码
水一个,以前百度看到的解法
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 00:12 , Processed in 0.017977 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表