[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文件操作] [已解决]批处理如何快速统计某目录下文件数?

本人工作需要写了个批处理,其中一段需要获取指定目录下文件的数量,写来写去总是存在效率问题,特发帖集思广益,求高效之法,问题简化如下(可用第三方):
文件夹ABC中可能存在8000-10000个左右的文件,为每隔一定时间软件自动拷贝而来,文件格式为“A_B.txt”,其中A、B均为数字,A不固定,B代表区域。(B≤9999)
文件列表示例如下:
1_1.TXT
1_2.TXT
1_3.TXT
2_4.TXT
2_2.TXT
......
1_1.TXT代表1区域的数据,1_2.TXT、2_2.TXT代表2区域的数据
现需统计文件所代表区域总数,即总共已拷贝多少区域?
(另一种表述:上示列表红色数字不重复的总个数是多少?)

PS:我采用的for /r、for /f+dir速度都不理想
  1. @echo off
  2. set t=%time%
  3. for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do (
  4.     if not defined @@%%i set /a upn+=1
  5.     set /a @@%%i=0
  6. )
  7. echo %t%
  8. echo %time%
复制代码
  1. @echo off
  2. set t=%time%
  3. for /r "abc" %%i in (*.txt) do (
  4.     for /f "tokens=2 delims=_" %%a in ("%%~ni") do (
  5.         if not defined @@%%a set /a upn+=1
  6.         set /a @@%%a=0
  7.     )
  8. )
  9. echo %t%
  10. echo %time%
复制代码
-------------------------------------------------------------------------------------------
问题延伸
◇此模块主要实现功能为求出剩余区域及数量
◇剩余区域需要先求出,当剩余区域大于某值时将不详细显示具体剩余区域
◇配置文件中有定义区域范围,如“1-9999”
◇根据指定文件夹(例如ABC文件夹)中已有文件求出剩余区域

[ 本帖最后由 zhouyongjun 于 2010-4-7 16:28 编辑 ]
1

评分人数

    • Batcher: 感谢主动给标题标注[已解决]字样PB + 2

原帖由 hanyeguxing 于 2010-4-8 18:24 发表


抄袭14楼的,然后改了下:@echo off
for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do set ID_%%i=0
set ID_|find /c "0"
pause呵呵,1万个ID_测试,快了0.1秒


按题目新建 文件md abc>nul&pushd abc& for /l %%i in (1,1,1000) do cd.>1_%%i.txt
试了下:

find /c "0"   改成 14 楼的 find /c /v ""
还要快些,  呵呵, 真是长见识了

[ 本帖最后由 x9tiancmd 于 2010-4-9 21:07 编辑 ]
    ╭╩═╮
╭╯G O ╠ 雁过留声
╰⊙═⊙╯

TOP

原帖由 FOR 于 2010-4-7 20:39 发表
这样呢?@echo off
for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do set ID_%%i=0
set ID_>tmp
for /f "tokens=3 delims= " %%I in ('find /c /v "" tem') do echo %%I
pause


抄袭14楼的,然后改了下:
  1. @echo off
  2. for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do set ID_%%i=0
  3. set ID_|find /c "0"
  4. pause
复制代码
呵呵,1万个ID_测试,快了0.1秒

[ 本帖最后由 hanyeguxing 于 2010-4-8 18:42 编辑 ]
2

评分人数

    • namejm: 不用临时文件,速度还那么快,真难得。PB + 10
    • x9tiancmd: set * | find 好方法PB + 5
寒夜孤星:在没有说明的情况下,本人所有代码均运行在 XP SP3 下 (有问题请发贴,QQ临时会话已关闭)

TOP

  1. @echo off
  2. for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do set ID_%%i=0
  3. (for /f "delims=" %%i in ('set ID_') do echo.)>tmp
  4. for %%i in (tmp) do set/a n=%%~zi/2
  5. echo.%n%
  6. pause
复制代码
1万个ID_测试,比14楼的依然慢了0.28秒,惭愧一个。。。

[ 本帖最后由 hanyeguxing 于 2010-4-8 18:43 编辑 ]
寒夜孤星:在没有说明的情况下,本人所有代码均运行在 XP SP3 下 (有问题请发贴,QQ临时会话已关闭)

TOP

  虽然楼上的代码避免了使用临时文件,但是,和其他使用了临时文件的代码相比,效率是很低下的,原因我在前面已经提过,那就是频繁地使用了 set /a 语句。
尺有所短寸有所长,学好批处理没商量;
考虑问题复杂化,解决问题简洁化。

心在天山,身老沧州。

TOP

  1. @echo off
  2. for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do set ID_%%i=0
  3. for /f %%I in ('set ID_') DO set/a n+=1
  4. echo %n%&pause
复制代码
寒夜孤星:在没有说明的情况下,本人所有代码均运行在 XP SP3 下 (有问题请发贴,QQ临时会话已关闭)

TOP

经测试14楼的效率比7楼的略低,难道是findstr和find查询效率的原因?

TOP

回复 13楼 的帖子

谢谢
我就是阅读了那个贴才有我9楼的修改,gawk之强值得学习

TOP

  哈哈,有更巧妙的方法出现了,更加有效率——不过后一句的文件名写错了,应该是tmp。
尺有所短寸有所长,学好批处理没商量;
考虑问题复杂化,解决问题简洁化。

心在天山,身老沧州。

TOP

这样呢?
  1. @echo off
  2. for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do set ID_%%i=0
  3. set ID_>tmp
  4. for /f "tokens=3 delims= " %%I in ('find /c /v "" tem') do echo %%I
  5. pause
复制代码
2

评分人数

    • x9tiancmd: find /c /v "" * 真是效率呀PB + 5
    • namejm: 查找最后一行行号的方法十分巧妙PB + 10

TOP

回复 8楼 的帖子

1、GNU是一个组织
2、awk文章收集
http://bbs.bathome.net/thread-3997-1-1.html
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

虽然结贴,然9楼有一点问题仍需要提出,采用gawk之法不能开启变量延迟
发现开启变量延迟结果变成文件数
具体原因不清楚

TOP

  7楼的代码在原有文本末尾强制添加换行符号,构造出一个带回车换行的空行,并巧妙地利用了findstr的特点,一举节约了大量时间,妙哉。
  本帖解决问题的过程堪称经典,十分具有借鉴意义,高亮之。
尺有所短寸有所长,学好批处理没商量;
考虑问题复杂化,解决问题简洁化。

心在天山,身老沧州。

TOP

不用第三方,7楼是目前的最优解
再次感谢各位
结贴

TOP

找了一下资料gawk真是太厉害了
GNU的代码这样改一下就可以达到我要求了
  1. dir /b abc\*.txt | gawk -F"[_.]" "{if (a[$2] != "1") a[$2]++ s++}END{print s}"
复制代码

[ 本帖最后由 zhouyongjun 于 2010-4-7 16:50 编辑 ]

TOP

返回列表