批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程
[批处理文件精品]批处理版照片整理器[批处理文件精品]纯批处理备份&还原驱动在线第三方下载
返回列表 发帖

[原创] [批处理命令一日一教学 续](13)字符串查找增强:findstr

【原】[一日一教学]批处理系列帖子索引 http://bbs.bathome.net/thread-2576-1-1.html
【续】[一日一教学]批处理系列帖子索引 http://bbs.bathome.net/thread-13798-1-1.html


帮助信息:
  1. 在文件中寻找字符串。
  2. FINDSTR [/B] [/E] [/L] [/R] [/S] [/I] [/X] [/V] [/N] [/M] [/O] [/P] [/F:file]
  3.         [/C:string] [/G:file] [/D:dir list] [/A:color attributes] [/OFF[LINE]]
  4.         strings [[drive:][path]filename[ ...]]
  5.   /B         在一行的开始配对模式。
  6.   /E         在一行的结尾配对模式。
  7.   /L         按字使用搜索字符串。
  8.   /R         将搜索字符串作为正则表达式使用。
  9.   /S         在当前目录和所有子目录中搜索匹配文件。
  10.   /I         指定搜索不分大小写。
  11.   /X         打印完全匹配的行。
  12.   /V         只打印不包含匹配的行。
  13.   /N         在匹配的每行前打印行数。
  14.   /M         如果文件含有匹配项,只打印其文件名。
  15.   /O         在每个匹配行前打印字符偏移量。
  16.   /P         忽略有不可打印字符的文件。  
  17.   /OFF[LINE] 不跳过带有脱机属性集的文件。
  18.   /A:attr    指定有十六进位数字的颜色属性。请见 "color /?"
  19.   /F:file    从指定文件读文件列表 (/ 代表控制台)。
  20.   /C:string  使用指定字符串作为文字搜索字符串。
  21.   /G:file    从指定的文件获得搜索字符串。 (/ 代表控制台)。
  22.   /D:dir     查找以分号为分隔符的目录列表
  23.   strings    要查找的文字。
  24.   [drive:][path]filename
  25.              指定要查找的文件。
  26. 除非参数有 /C 前缀,请使用空格隔开搜索字符串。
  27. 例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
  28. "there"。'FINDSTR /C:"hello there" x.y' 文件 x.y  寻找
  29. "hello there"。
  30. 正则表达式的快速参考:
  31.   .        通配符: 任何字符
  32.   *        重复: 以前字符或类出现零或零以上次数
  33.   ^        行位置: 行的开始
  34.   $        行位置: 行的终点
  35.   [class]  字符类: 任何在字符集中的字符
  36.   [^class] 补字符类: 任何不在字符集中的字符
  37.   [x-y]    范围: 在指定范围内的任何字符
  38.   \x       Escape: 元字符 x 的文字用法
  39.   \<xyz    字位置: 字的开始
  40.   xyz\>    字位置: 字的结束
  41. 有关 FINDSTR 常见表达法的详细情况,请见联机命令参考。
复制代码
这则帮助信息中,我将“一般表达式”,全部替换成了“正则表达式”(一切都是机器翻译惹的祸)。


命令概括:
findstr,全英文find string,意为“查找字符串”;

/b,全英文begin,意为“开始”;
/e,全英文end,意为“末端”;
/l,literally,意为“照字面地”;引申为“去正则表达式”。
/r,regular,意为“有规律的”;引申为“正则表达式”。
/s,subdirectory,意为“子目录”;
/i,ignore,意为“忽略”;引申为“忽略大小写”;
/x,exactly,意为“恰好地”;引申为“完全匹配”;(一开始意为不是这个单词,不过HAT确实高明——之所以以e为缩写,是因为前面有了end的缩写,所以以第二个字母x为缩写)。
/v,invert,意为“反转、使颠倒”(感谢doupip的单词提供);
/n,全英文number,意为“数字”;引申为“行号”;
/m,merely,意为“只是”;
/o,offset,意为“偏移”;
/p,print,意为“打印”;
/off[line],意为“脱机文件”;
/a,attribute,意为“属性”;
/f,file,意为“文件”;
/c,case,意为“把几个字加起来”;引申为“全部字匹配”;
/g,get,意为“获得”;
/d,directory,意为“目录”;
class,类。

感谢HAT的单词提供。

感谢weichengxiehou。

参数详解部分13-14节都是从weichengxiehou的帖子里复制来的(既然有现成了,省心多少),原帖地址



参数详解:
学习findstr需要大量的实践体会,所以需要新建一些txt文本以供测试。

a.txt的内容(a.txt的内容在后面会多次修改,请注意!):
  1. Hello World
  2. Hello Boy
  3. hello ,good man.
  4. goodbye!
复制代码
1.最简单的应用:在指定文本中查找指定字符串
代码:
  1. findstr "hello" a.txt
复制代码
结果:
  1. C:\Users\helloworld\Desktop>findstr "hello" a.txt
  2. hello ,good man.
复制代码
代码:
  1. findstr "Hello" a.txt
复制代码
结果:
  1. C:\Users\helloworld\Desktop>findstr "Hello" a.txt
  2. Hello World
  3. Hello Boy
复制代码
这里可以看出,
findstr默认是区分大小写的(跟find命令一样)——找hello就不会出现Hello,反之亦然。


怎么让其不区分大小写呢?
用/i参数!
例如:
  1. C:\Users\helloworld\Desktop>findstr /i "Hello" a.txt
  2. Hello World
  3. Hello Boy
  4. hello ,good man.
复制代码
2.显示要查找的字符具体在文本哪一行
代码:
  1. C:\Users\helloworld\Desktop>findstr /n /i "hello" a.txt
复制代码
效果:
  1. 1:Hello World
  2. 2:Hello Boy
  3. 3:hello ,good man.
复制代码
显示的结果中冒号(:)是英文格式下的,在用for提取的时候需要注意!

这里可以对比一下find命令的/n参数:
代码:
  1. C:\Users\helloworld\Desktop>find /n "hello" a.txt
复制代码
效果:
  1. ---------- A.TXT
  2. [3]hello ,good man.
复制代码
冒号(:)和中括号([]),这就是差别,编写代码的时候一定要注意。

3.查找包含了指定字符的文本
代码:
  1. C:\Users\helloworld\Desktop>findstr /m /i "hello" *.txt
复制代码
效果:
  1. 1.txt
  2. a.txt
复制代码
1.txt中的类容如下:
  1. 除非参数有 /C 前缀,请使用空格隔开搜索字符串。
  2. 例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
  3. "there"。'FINDSTR /C:"hello there" x.y' 文件 x.y  寻找
  4. "hello there"。
复制代码
由于加上了/m参数,所以只列出包含指定字符的文件名。

4.查找以指定字符开始或结尾的文本行
这个功能和前面介绍的最大不同就在于涉及到了“元字符”,如果你不明白什么是“元字符”,那也不用担心学不好这一节,这就好像不明白“water”是什么,也不会影响喝水。

a.txt内容:
  1. good hello
  2. 你好 hello world
  3. Hello World
  4. Hello Boy
  5. hello ,good man.
  6. goodbye!
复制代码
如何查找以hello(忽略大小写)开始的行?

两种方法:

①./b参数
代码:
  1. C:\Users\helloworld\Desktop>findstr /b /i "hello" a.txt
复制代码
效果:
  1. Hello World
  2. Hello Boy
  3. hello ,good man.
复制代码
good hello 和 你好 hello world,这两行都没有显示出来,因为hello不在行的开始处。

②.^符
这里的^可不是转义符,而是正则表达式中的“匹配行开始的位置”。
代码:
  1. C:\Users\helloworld\Desktop>findstr  /i "^hello" a.txt
复制代码
效果:
  1. Hello World
  2. Hello Boy
  3. hello ,good man.
复制代码
学完了以查找指定字符开始的行,下面学习查找以指定字符结尾的行。


如何查找以hello(忽略大小写)结尾的行?
同样有两种方法:

①./e参数
代码:
  1. C:\Users\helloworld\Desktop>findstr /e /i "hello" a.txt
复制代码
结果:
  1. good hello
复制代码
只显示了“good hello”,因为其它行虽然有“hello”,但是他们都没有以“hello”结尾。

②.$符
代码:
  1. C:\Users\helloworld\Desktop>findstr  /i "hello$" a.txt
复制代码
结果:
  1. good hello
复制代码
到此,我们已经学习了两个正则表达式的元字符:^和$(分别和他们功能相对应的有/b、/e参数)。


5.查找与指定字符完全匹配的行

首先修改a.txt的内容:
  1. hello
  2. hello hello
  3. good hello
  4. 你好 hello world
  5. Hello World
  6. Hello Boy
  7. hello ,good man.
  8. goodbye!
复制代码
懂得举一反三的的童鞋可能会试着尝试以下代码:
  1. C:\Users\helloworld\Desktop>findstr /n /i "^hello$" a.txt
复制代码
结果让你倍感欣喜:
  1. 1:hello
复制代码
其实除了这一种方法外,findstr命令还提供了/x参数用来查找完全匹配的行。
代码:
  1. C:\Users\helloworld\Desktop>findstr /n /i /x "hello" a.txt
复制代码
结果:
  1. 1:hello
复制代码
.

6.关闭正则表达式会怎么样?
我们可以人为地将findstr分为两种模式,“正则表达式模式”和“普通字符串模式”。

findstr默认为“正则表达式模式”,加上/r参数也是“正则表达式模式”(换言之,/r参数有点多余)。
加上/l参数后,findstr转换为“普通字符串模式”(其实find就是这种模式、且只有这种模式)。

“普通字符串模式”下,以同样的代码,看看结果怎样?
代码:
  1. C:\Users\helloworld\Desktop>findstr /li "^hello" a.txt
复制代码
结果什么都没显示出来。

以hello开头的行明明有以下这些,为什么没显示出来呢?
  1. hello hello
  2. Hello World
  3. Hello Boy
  4. hello ,good man.
复制代码
因为,当你使用“普通字符串模式”,findstr不会把^当做是正则表达式的元字符,而只是把其当做普通字符^,也就是说它此时已经不具备“表示行首”的功能,变成了和h之类字符一样的普通民众,再也没“特权”。

改变a.txt的内容:
  1. ^hello
  2. hello
  3. hello hello
  4. good hello
  5. 你好 hello world
  6. Hello World
  7. Hello Boy
  8. hello ,good man.
  9. goodbye!
复制代码
再次运行代码:
  1. C:\Users\helloworld\Desktop>findstr /nli "^hello" a.txt
复制代码
结果:
  1. 1:^hello
复制代码
.


7.查找不包含指定字符的行
如果比较一下find和findstr命令就会发现,他们都具有/v,/n,/i,/off[line]参数,而且功能都是一摸一样的,这里说的就是/v参数。

查找不包含hello的行。
代码:
  1. C:\Users\helloworld\Desktop>findstr /vni "hello" a.txt
复制代码
结果:
  1. 9:goodbye!
复制代码
.


8.如何查找当前目录及子目录下文件内容中包含某字符串的文件名?

在写这篇教程的时候,偶然看到有批友问了这个问题,问题地址:http://bbs.bathome.net/viewthread.php?tid=14727

代码:
  1. findstr /ms "专业" *.txt
复制代码
效果:
找出当前目录及子目录下文件内容中包含“专业”的文本文件,并只显示其文件名。


9.用文本制定要查找的文件 And 用文本制定要查找的字符串

用文本制定要查找的文件

新建一个file.txt,内容如下(这个文本中指定findstr要查找的文本的路径):
  1. C:\Users\helloworld\Desktop\1.txt
  2. C:\Users\helloworld\Desktop\a.txt
  3. C:\Users\helloworld\Desktop\clip.txt
  4. C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
  5. C:\Users\helloworld\Desktop\file.txt
  6. C:\Users\helloworld\Desktop\MyRarHelp.txt
  7. C:\Users\helloworld\Desktop\test.txt
  8. C:\Users\helloworld\Desktop\红楼.txt
  9. C:\Users\helloworld\Desktop\520\新建文本文档.txt
  10. C:\Users\helloworld\Desktop\520\12\hello_ world.txt
  11. C:\Users\helloworld\Desktop\编程\help.txt
  12. C:\Users\helloworld\Desktop\编程\win7 help比xp help多出来的命令.txt
  13. C:\Users\helloworld\Desktop\编程\wmic.txt
复制代码
.


代码:
  1. C:\Users\helloworld\Desktop>findstr /f:file.txt /im "hello"
复制代码
效果:
  1. C:\Users\helloworld\Desktop\1.txt
  2. C:\Users\helloworld\Desktop\a.txt
  3. C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
  4. C:\Users\helloworld\Desktop\file.txt
  5. C:\Users\helloworld\Desktop\test.txt
复制代码
.


用文本制定要查找的字符串

新建一个string.txt,内容如下(这个文本中指定findstr要查找的字符串):
  1. ^hello
  2. world
复制代码
.


a.txt
  1. ^hello
  2. hello
  3. hello hello
  4. good hello
  5. 你好 hello
  6. Hello World
  7. Hello Boy
  8. hello ,good man.
  9. goodbye!
复制代码
代码:
  1. C:\Users\helloworld\Desktop>findstr /ig:string.txt a.txt
复制代码
效果:
  1. hello
  2. hello hello
  3. Hello World
  4. Hello Boy
  5. hello ,good man.
复制代码
.

被忽略的行
  1. ^hello
  2. good hello
  3. 你好 hello
  4. goodbye!
复制代码
.


从被忽略的“^hello”可以看出,在不加/l参数的前提下,用/g指定的搜索字符串中如果含有“元字符”,则作为正则表达式使用,而不是作为普通表达式。



10.搜索一个完全匹配的句子

其实findstr自带的帮助中就有个很好的例子:

例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
"there"。'FINDSTR /C:"hello there" x.y' 文件 x.y  寻找
"hello there"。


可以以这个例子来做个测试。
a.txt
  1. hello there
  2. hellothere
  3. hello
  4. there
复制代码
.


代码:
  1. C:\Users\helloworld\Desktop>findstr /ic:"hello there" a.txt
复制代码
结果:
  1. hello there
复制代码
这就是句子的完全匹配了。


11.搜索一个完全匹配的词。
这里也涉及到了两个元字符:\<,\>。

先试看一个例子。
a.txt
  1. far there
  2. farthere
  3. there
  4. far
  5. farm
  6. farmer
复制代码
.


代码:
  1. C:\Users\helloworld\Desktop>findstr "far" a.txt
复制代码
结果:
  1. far there
  2. farthere
  3. far
  4. farm
  5. farmer
复制代码
.

我的本意是要查找含有“far”这个单词的行,但是farthere、farm、farmer却显示出来了,这不是我想要的结果。


如果只要求显示含有“far”这个单词的行,该怎么写呢?
代码:
  1. C:\Users\helloworld\Desktop>findstr "\<far\>" a.txt
复制代码
结果:
  1. far there
  2. far
复制代码
.


12.指定要查找的目录

/d参数我一直把它和/f、/g归为一类,但其实二者截然不同,/f、/g是用文本文件制定要查找的文件、字符串,而/d是直接书写目录名到命令中。


代码:
  1. C:\Users\helloworld\Desktop>findstr /imd:520;编程; ".*" "*.txt"
复制代码
结果:
  1. 520:
  2. hello.txt
  3.   编程:
  4. help.txt
  5. win7 help比xp help多出来的命令.txt
  6. wmic.txt
复制代码
查找在520、编程目录中所有包含任意字符的txt文件。


13.统计字符数
/o:在每行前打印字符偏移量,在找到的每行前打印该行首距离文件开头的位置,也就是多少个字符,如test.txt中有如下内容:
  1. aaaaaaaaaa
  2. aaaaaaaaaa
  3. aaaaaaaaaa
  4. aaaaaaaaaa
  5. aaaaaaaaaa
  6. aaaaaaaaaa
复制代码
执行命令:
  1. findstr /o .* test.txt
复制代码
::上一行中的.*为正则表达式的内容,表示任意行,包含空行
结果如下:
  1. 0:aaaaaaaaaa
  2. 12:aaaaaaaaaa
  3. 24:aaaaaaaaaa
  4. 36:aaaaaaaaaa
  5. 48:aaaaaaaaaa
复制代码
注意每行末尾的回车换行符算两个字符。


14.以指定颜色显示文件名
/a:当被搜索文件名中含有通配符*或?时对搜索结果的文件名部分指定颜色属性,具体颜色值参见color帮助:
0 = 黑色       8 = 灰色
1 = 蓝色       9 = 淡蓝色
2 = 绿色       A = 淡绿色
3 = 浅绿色     B = 淡浅绿色
4 = 红色       C = 淡红色
5 = 紫色       D = 淡紫色
6 = 黄色       E = 淡黄色
7 = 白色       F = 亮白色
常用于彩色显示,举个简单的例子,想要彩色显示“批处理之家”怎么办,假如当前的color设置为27(背景绿色,字体白色),用蓝色显示“批处理之家”咋办?::下一行的退格符可以在cmd的编辑模式下按ctrl+p后按退格键获得
  1. >"批处理之家" set /p=<nul
  2. findstr /a:21 .* "批处理之家*"
  3. pause
复制代码
代码中的退格符是为了让显示的内容仅为"批处理之家",如果有其他内容,在彩色显示的"批处理之家"后还有一个冒号和其他内容,退格符正好将冒号删除。注意代码中的通配符是必须的。

15.findstr中的元字符


16.未讲解的内容:/p,/off[line]

这两个命令不明白是什么意思,因为不知道什么是“不可打印字符”、“带有脱机属性集的文件”,望有识之士给予解答。

扩展阅读:

1.什么是正则表达式:http://zh.wikipedia.org/zh/%E6%A ... 8%E8%BE%BE%E5%BC%8F

2.正则表达式30分钟入门教程(非常好的教程,极力推荐):http://deerchao.net/tutorials/regex/regex.htm
附件: 您需要登录才可以下载或查看附件。没有帐号?注册
3

评分人数

大工程...

TOP

/L         Uses search strings literally.
/R         Uses search strings as regular expressions.
/X         Prints lines that match exactly.
1

评分人数

TOP

好文,顶一个!

TOP

非常棒,好好学习。
赞成“拿来主义”,但是鄙视“伸手党”

TOP

本帖最后由 doupip 于 2011-12-23 10:31 编辑

楼主辛苦~
  1. /v,未知;
复制代码
/v参数也是一个通用项.英文表达是invert-match 即反选,反转匹配模式  =select non-matching
在linux中的许多命令中也适用,只不过linux中是严格区分大小分,此参数用的是-V
  1. /c,case,意为“把几个字加起来”;引申为“全部字匹配”;
复制代码
/c:string     Uses specified string as a literal search string.  如果要用英文单词来帮助记忆的话,我觉得是character string更合适.
1

评分人数

TOP

我来学习的同时,把我摸索出的一点 /r 应用说一下 :
看到/c 参数 很容易知道——如果希望查找匹配项是含空格的一串字符,而不是分别匹配空格分隔的多项,可以加/c: 如
  1. echo a bc|findstr/c:"a bc"
复制代码
可是必须空格数也要准确一致,如果希望能匹配字符串中含不定数目的空格呢?/r 就发挥作用了
  1. echo a    bc|findstr/rc:"a\ *b"
复制代码
1

评分人数

TOP

其他的不是很难,关键是正则表达式这里最好多点例子。
寂寞是黑白的,但黑白不是寂寞,是永恒。BAT 需要的不是可能,而是智慧。

TOP

回复 7# yyykkkyyyy
  1. echo a    bc|findstr/rc:"a\ *b"
复制代码
这个确实是意料之外的,那本《正则表达式入门经典》信誓旦旦的说“即使不指定/r,这也是默认行为”——其它测试这个说法是没问题的,但在空格这点上确实加了/r才会有结果。

莫非猫腻在“\”这个特殊的转义符?

TOP

我明白了!不在于“\”这个符号,“即使不指定/r,这也是默认行为”也没有错,关键是/c的特性——将字符链接起来,有去正则表达式的效果。

证明:
Findstr ".*" 1.txt
显示所有1.txt中的内容

Findstr /c:".*" 1.txt
什么也不显示,因为1.txt中没有包含“.*”的项。

TOP

回复 8# cjiabing


正则表达式简介
http://www.bathome.net/thread-4485-1-1.html

批处理findstr命令正则表达式的基本用法
http://www.bathome.net/thread-24-1-1.html

TOP

在处理一些字符(比如有时候是中文,没有总结)时,用findstr /r 或findstr /l 试试。
寂寞是黑白的,但黑白不是寂寞,是永恒。BAT 需要的不是可能,而是智慧。

TOP

感谢出了续集,学习下

TOP

支持了,我很久到这里看看了。

TOP

find "\<XXX\>" xxx.txt查找字符串的时候会将特殊字符(非字母数字)视为合法,如xx.txt内容为:
hello&%$+
hello world
helloworld
执行命令:findstr /i  "\<hello\>" 123.txt
结果为:
hello&%$+
hello world
感觉这两个元字符确实有些不足呀!
1

评分人数

    • xuhuoren: 确实啊,看来在设计的时候没有考虑到这种特 ...技术 + 1

TOP

返回列表