- 帖子
- 1150
- 积分
- 1997
- 技术
- 239
- 捐助
- 0
- 注册时间
- 2017-3-20
|
本帖最后由 flashercs 于 2018-12-5 15:46 编辑
cmd踩的坑多了去了.就像以前某论坛写cmd里stdout 的字符都是Unicode编码,一直信以为真,后来踩了坑才知道是错误的.
type和more都可以识别ansi和Unicode-BOM编码的文本,但type输出到console的文本编码与源文件一致,而more输出到控制台的编码是ANSI的,它是转码的;
findstr是按ANSI编码搜索字符串的,忽视文本编码,而find却可以正确识别编码.
dir 对于office文档格式的文件搜索是不准确的,比如dir *.doc ,搜索结果会包括.doc,.docx,.doct,.docm...等任何扩展名以.doc开头的文件.
管道|,在不指定Unicode输出时,| 前面的指令会转码成ANSI,这就会导致一些Unicode文件名的识别失败,虽然几率很小.比如dir /a /b /s *.txt|cscript -nologo a.js;让a.js来处理stdin 文本,但是若文件名含有无法转换成ANSI的Unicode字符就会变成?,比如文件名 "1👀💋🎶🚗0.txt",就会变成了"1????????0.txt",这显然是找不到该文件的.
这都是坑.不踩过能知道? |
|