Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

1楼 跳转到 » 倒序看帖

字体大小: tT

发表于 2010-4-7 10:31 | 显示全部帖子

[文件操作] [已解决]批处理如何快速统计某目录下文件数？

本人工作需要写了个批处理，其中一段需要获取指定目录下文件的数量，写来写去总是存在效率问题，特发帖集思广益，求高效之法，问题简化如下（可用第三方）：
文件夹ABC中可能存在8000-10000个左右的文件，为每隔一定时间软件自动拷贝而来，文件格式为“A_B.txt”，其中A、B均为数字，A不固定，B代表区域。（B≤9999）
文件列表示例如下：
1_1.TXT
1_2.TXT
1_3.TXT
2_4.TXT
2_2.TXT
......
1_1.TXT代表1区域的数据，1_2.TXT、2_2.TXT代表2区域的数据
现需统计文件所代表区域总数，即总共已拷贝多少区域？
（另一种表述：上示列表红色数字不重复的总个数是多少？）

PS:我采用的for /r、for /f+dir速度都不理想

@echo off
set t=%time%
for /f "tokens=2 delims=_." %%i in ('dir /b abc\*.txt') do (
    if not defined @@%%i set /a upn+=1
    set /a @@%%i=0
)
echo %t%
echo %time%
复制代码

 
@echo off
set t=%time%
for /r "abc" %%i in (*.txt) do (
    for /f "tokens=2 delims=_" %%a in ("%%~ni") do (
        if not defined @@%%a set /a upn+=1
        set /a @@%%a=0
    )
)
echo %t%
echo %time%
复制代码

-------------------------------------------------------------------------------------------
问题延伸
◇此模块主要实现功能为求出剩余区域及数量
◇剩余区域需要先求出，当剩余区域大于某值时将不详细显示具体剩余区域
◇配置文件中有定义区域范围，如“1-9999”
◇根据指定文件夹（例如ABC文件夹）中已有文件求出剩余区域

[ 本帖最后由 zhouyongjun 于 2010-4-7 16:28 编辑 ]

1 评分人数

Batcher: 感谢主动给标题标注[已解决]字样PB + 2

zhouyongjun

上校

Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

2楼

发表于 2010-4-7 11:49 | 显示全部帖子

回复 3楼的帖子

第三方也行，因为是工作需要，不要考虑太多可移植性，速度第一位

TOP

zhouyongjun

上校

Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

3楼

发表于 2010-4-7 14:49 | 显示全部帖子

感谢楼上几位
原来set /a 的赋值效率竟没有直接set高。
测试文件8000个，我顶楼第一个代码17S，第二个21S，第一个set /a 改为set 15S
JM的代码为12S，neorobin的代码有了很大的提速，将近5S
最快的是GUN兄的，但似乎只求出的文件数，并没考虑一个区域存在两个文件或多个
搜索了gawk，发现GUN竟是原创作者，先敬仰一下。
但是未曾发现gawk的帮助内容，不知GUN兄可否再帮忙一下。

TOP

zhouyongjun

上校

Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

4楼

发表于 2010-4-7 16:25 | 显示全部帖子

找了一下资料gawk真是太厉害了
GNU的代码这样改一下就可以达到我要求了

dir /b abc\*.txt | gawk -F"[_.]" "{if (a[$2] != "1") a[$2]++ s++}END{print s}"
复制代码

[ 本帖最后由 zhouyongjun 于 2010-4-7 16:50 编辑 ]

TOP

zhouyongjun

上校

Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

5楼

发表于 2010-4-7 16:28 | 显示全部帖子

不用第三方，7楼是目前的最优解
再次感谢各位
结贴

TOP

zhouyongjun

上校

Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

6楼

发表于 2010-4-7 17:05 | 显示全部帖子

虽然结贴，然9楼有一点问题仍需要提出，采用gawk之法不能开启变量延迟
发现开启变量延迟结果变成文件数
具体原因不清楚

TOP

zhouyongjun

上校

Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

7楼

发表于 2010-4-8 09:42 | 显示全部帖子

回复 13楼的帖子

谢谢
我就是阅读了那个贴才有我9楼的修改，gawk之强值得学习

TOP

zhouyongjun

上校

Rank: 6 Rank: 6

帖子: 187
积分: 3142
技术: 3
捐助: 0
注册时间: 2008-10-30

8楼

发表于 2010-4-8 09:44 | 显示全部帖子

经测试14楼的效率比7楼的略低，难道是findstr和find查询效率的原因？

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[文件操作] [已解决]批处理如何快速统计某目录下文件数？

回复 3楼的帖子

回复 13楼的帖子

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

[文件操作] [已解决]批处理如何快速统计某目录下文件数？

回复 3楼 的帖子

回复 13楼 的帖子

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

回复 3楼的帖子

回复 13楼的帖子