Board logo

标题: [文件操作] 批处理怎么对比文件夹下包括子目录下的文件相同的判断,MD5值? [打印本页]

作者: 649918043    时间: 2014-8-23 21:21     标题: 批处理怎么对比文件夹下包括子目录下的文件相同的判断,MD5值?

本帖最后由 649918043 于 2014-8-23 23:41 编辑

问下怎么对比文件夹下包括子目录下的文件相同的判断,最好以MD5值来判断,他们有的文件名不一样,

还有个问题就是 某文件夹下包括子目录的文件,,TXT怎么整理重复行,我用gawk.exe第三方最多只可整理600MB的文本重复行,请教下这样的情况用什么,因该怎么写


这个批处怎么写,麻烦给个例子
作者: DAIC    时间: 2014-8-23 22:52

整理重复是什么意思?
请给出原始文本内容、你希望得到的结果、你现在的gawk完整命令
作者: 649918043    时间: 2014-8-23 22:58

重复行~~~~~~~~~~~~
作者: 649918043    时间: 2014-8-23 22:59

整理重复行的意思
作者: 649918043    时间: 2014-8-23 23:11

gawk "!a[$0]++"<888.txt>1.txt
只可以整理重复行最多500MB多不到600
作者: CrLf    时间: 2014-8-24 22:48

用 md5 的话,可以这样:
  1. hash /s /f /d:"你的路径" /format:"%s|%s|%s\r\n",md5,attrib,string *.txt | sort
复制代码
然后判断相邻行是否重复就行
使用第三方工具 hash.exe,下载地址:http://bbs.bathome.net/thread-30609-1-1.html
作者: 649918043    时间: 2014-8-25 12:30

回复 6# CrLf


麻烦解释下好吗???运行了,,一直没反映,,
作者: CrLf    时间: 2014-8-25 15:30

回复 7# 649918043


hash /s /f /d:"你的路径" /format:"%s|%s|%s\r\n",md5,attrib,string *.txt
将 "你的路径" 和其子目录下所有 txt 文件逐行读入,输出 md5值|来源文件|当前行内容
把这句的输出用 sort 排序后,可以直接判断相邻行的 md5 值是否相同来找出相同行
作者: 649918043    时间: 2014-8-28 14:48

回复 8# CrLf 3


运行不了  提示好象要输入一个 最大值,,,好象是输出的 什么最大值,,怎么写成或者TXT   这个因该怎么写




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2