[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 这样理解sed对不对

今天遇到个问题,要把很多个文本里的0替换成1,文本很短,就1-2行,0也就出现一次,我就没多想用powershell大概这样写
  1. (gc a.txt) -replace '0','1' | out-file -encoding oem b.txt
复制代码
对大多数文件没出错
但是
有几个文件是二进制编码,但用记事本打开能看到一部分正常的字符
这替换出来就错了不少。。。
后来改成
  1. sed 's/0/1/' a.txt > b.txt
复制代码
暂时没有出错

就想问问大家,sed替换是不管字符编码的吗,这样理解是否正确,这种替换方式是否安全,是否需要把二进制的文件先转16进制数的表达方式,然后找到数字替换后再转回二进制?
谢谢啦

回复 2# Five66


    多谢
又搜了一会,好像不同sed版本不太一样,不过powershell确实默认就解码了,然后就丢了一部分信息。。。
我这用的busybox sed,不管编码只是替换,用在这里方便一点

谢谢

TOP

无非就2种
使用某一编码作为默认编码或自动判断编码
powershell是默认的
sed好像也是默认的,貌似会忽略无法解码的

TOP

返回列表