找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 22828|回复: 5

[文本处理] 批处理如何根据文本前8个字母 删除重复项?

[复制链接]
发表于 2012-12-4 19:57:55 | 显示全部楼层 |阅读模式
4f044489-----G:\JBS\今天\1000000.pdf
ccbee259-----G:\JBS\今天\1000001.pdf
5f7babd1-----G:\JBS\今天\1000002.pdf
592858e0-----G:\JBS\今天\1000003.pdf
0bdbf2f0-----G:\JBS\今天\1000004.pdf
0bdbf2f0-----G:\JBS\今天\1000009.pdf
81142b94-----G:\JBS\今天\1000005.pdf
144be708-----G:\JBS\今天\1000006.pdf

前8个字母是固定的  -----后面是文件的路径和文件名
前8个字母里有些是重复 请把重复的剔除  保留一组
例如
0bdbf2f0-----G:\JBS\今天\1000004.pdf
0bdbf2f0-----G:\JBS\今天\1000009.pdf

0bdbf2f0出现2次 删除其中一组 保留一组
发表于 2012-12-4 20:13:58 | 显示全部楼层
本帖最后由 weichenxiehou 于 2012-12-4 20:47 编辑

如果要删除实际的文件:

  1. @echo off&setlocal enabledelayedexpansion
  2. md backup 2>nul
  3. ::将下一行的a.txt替换为实际文本名
  4. for /f "tokens=1* delims=-" %%a in ('sort a.txt') do (
  5.   if "!str!"=="%%a" move "%%b" backup\
  6.   set "str=%%b"
  7. )
复制代码
如果只是修改文本:
  1. gawk -F- "{arr[$1]++;if(arr[$1]==1)print}"a.txt>result.txt
复制代码
 楼主| 发表于 2012-12-4 21:00:25 | 显示全部楼层
weichenxiehou
gawk -F- "{arr[$1]++;if(arr[$1]==1)print}"a.txt>result.txt  
这段代码在CMD里运行失败


C:\Documents and Settings\Administrator>cd c:\

C:\>gawk -F- "{arr[$1]++;if(arr[$1]==1)print}"a.txt>result.txt
gawk: {arr[$1]++;if(arr[$1]==1)print}a.txt
gawk:                                 ^ syntax error
发表于 2012-12-4 21:21:42 | 显示全部楼层
回复 3# necnec1
a.txt前面少了一个空格,加上试试吧。
 楼主| 发表于 2012-12-4 21:50:45 | 显示全部楼层
非常好使 已完美解决 谢谢weichenxiehou
发表于 2012-12-5 11:04:22 | 显示全部楼层
回复 2# weichenxiehou


简化一下:
  1. gawk -F- "!a[$1]++" a.txt >b.txt
复制代码

评分

参与人数 1技术 +1 收起 理由
weichenxiehou + 1 够精简。

查看全部评分

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 20:34 , Processed in 0.019099 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表