本帖最后由 WHY 于 2018-6-13 10:01 编辑
第二行的两个 <br><br> 之间有一个 回车符(\r、0x0D)
win系统文本里回车换行(\r\n)一般都是成对出现,一般不会出现单独的 \r
建议获取网页内容不要直接用 findstr,1.超长行会挂;2.文本编码 utf8 会挂。
可以考虑 第三方工具,也可以考虑 PowerShell、vbs 等。
举例:- PowerShell -c "$s=(type test1.ini) -join \"`r`n\";[regex]::Matches($s,'<br>(?:(?!<br>).)+<br>')|%%{$_.Value}"
复制代码 一定要用 findstr,先用 sed 去掉单独的 \r- sed -r "s/<br>\x0D<br>/<br><br>/g" test1.ini > test11.ini
复制代码
|