[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 文本内容如何用批处理去重?

假如文件123.txt的内容如下,如何将内容输出为每行都是唯一的!

张三
张三
李四
[email]zhangsan@163.com[/email]
张三
李四
[email]lisi@163.com[/email]
李四
[email]wangwu@163.com[/email]
[email]lisi@163.com[/email]

  1. @echo off
  2. gawk "!a[$0]++" 测试.txt >结果.txt
  3. pause
复制代码

TOP

  1. @echo off
  2. (for /f "delims=" %%a in ('type "测试.txt"') do if not defined %%a (echo,%%a &set %%a=def))>"结果.txt"
  3. pause
复制代码

TOP

pcl_test 发表于 2015-4-18 17:42



debug>gawk "!a[$0]++" 123.txt
gawk: cmd. line:1: (FILENAME=123.txt FNR=1) fatal: print to "standard output" failed (Exec format error)

好像不支持中文!

TOP

回复 4# shootman2

不是你这样用的

TOP

回复  shootman2

不是你这样用的
pcl_test 发表于 2015-4-18 18:06



    请指教!

TOP

  1. @echo off
  2. sort 123.txt|uniq >b.txt
复制代码

TOP

回复 7# bailong360


    还是不好使。。。

TOP

回复 5# pcl_test
  1. gawk "!a[$0]++" "测试.txt"| more
复制代码
如果你所说的不支持中文,是指中文不能输出到标准输出,那么是有这个问题,这种情况通常要用重定向

TOP

回复  pcl_test 如果你所说的不支持中文,是指中文不能输出到标准输出,那么是有这个问题,这种情况通常要用 ...
pcl_test 发表于 2015-4-18 20:12



    嗯!问题解决了,但是这个语句该怎么理解呢? 继续请教大神!

TOP

回复 10# shootman2


理解这个语句需要具备基础的awk知识
http://bbs.chinaunix.net/viewthread.php?tid=1672726#pid11904888
Talk is cheap. Show me the code.
没事不要瞎扯淡,有能耐就把代码贴出来给我看。

TOP

有没有其他什么好的方法?

TOP

回复  pcl_test 如果你所说的不支持中文,是指中文不能输出到标准输出,那么是有这个问题,这种情况通常要用 ...
pcl_test 发表于 2015-4-18 20:12



好奇怪,如果启用了变量延迟,程序就卡住一直不动了!

@echo off
setlocal enabledelayedexpansion
set aaa=d:\user_list.txt
for /f "tokens=* delims=" %%m in ('gawk "!a[$0]++" "!aaa!"') do (
        echo %%m
)
pause

TOP

回复 9# pcl_test
  1. gawk "!a[$0]++" 1.txt >con
复制代码
用con比较好
Talk is cheap. Show me the code.
没事不要瞎扯淡,有能耐就把代码贴出来给我看。

TOP

回复 13# shootman2
在你的代码可以不开变量延迟
  1. @echo off
  2. set "aaa=d:\user_list.txt"
  3. for /f "tokens=* delims=" %%m in ('gawk "!a[$0]++" "%aaa%"') do echo %%m
  4. pause
复制代码
要开的话,要对!转义
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. set "aaa=d:\user_list.txt"
  4. for /f "tokens=* delims=" %%m in ('gawk "^!a[$0]++" "!aaa!"') do echo %%m
  5. pause
复制代码

TOP

返回列表