批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程
[批处理文件精品]批处理版照片整理器[批处理文件精品]纯批处理备份&还原驱动在线第三方下载
返回列表 发帖

[其他] 【已解决】fr.exe(find - replace)的正则匹配问题

本帖最后由 kidzgy 于 2022-11-29 19:15 编辑

fr文件http://bcn.bathome.net/tool/2.1.7.0424/fr.exe
fr文件操作说明:http://baiy.cn/utils/fr/index.htm
正则测试文件(文件名为extensions.json,全文单行内容)https://pastebin.ubuntu.com/p/QfgD7xzntJ/plain/
正则测试主要内容(源测试文件内容较多,将无关内容去除后的主要内容)
  1. "path":"D:\\Firefox106\\Profiles\\extensions\\s3google@translator.xpi","path":"D:\\Firefox106\\browser\\features\\screenshots@mozilla.org.xpi",,"path":"D:\\Firefox106\\browser\\features\\webcompat@mozilla.org.xpi",
复制代码
正则测试语句:
  1. \"path\"\:\".*?\\\\(browser\\\\features|Profiles\\\\extensions).*?
复制代码
要点:
  1. (1)【D:\\Firefox106】路径不唯一,它可以是任何路径,任意文件夹名。fr的最终目的就是,不管当前路径如何,在fr.exe后,重新刷新为当前路径。比如,当前路径是【D:\\Firefox106】,但我又把Firefox106文件夹放到【C:\123】在fr.exe,那路径就该是【C:\123\Firefox106】。
  2. (2)在用 regex101.com 测试的时候,通过上述测试语句搜索,匹配的内容是【D:\\Firefox106\\Profiles\\extensions】或【D:\\Firefox106\\browser\\features】
复制代码
,并且将【Profiles\\extensions】或【browser\\features】设置为【组1(即\1)】。

我在regex101测试内容截图:



我的批处理命令行内容如下:
  1. @ECHO OFF&(PUSHD "%~DP0")
  2. set firefox=%~DP0
  3. set firefox1=%firefox:\=/%
  4. set firefox2=%firefox:\=\\\\%
  5. fr.exe "extensions.json" -ric:"***:file:\/\/\/.*?\/(Profiles\/extensions|browser\/features).*?" -t:"file:///%firefox1%\1"
  6. fr.exe "extensions.json" -ric:"***:\"path\"\:\".*?\\\\(browser\\\\features|Profiles\\\\extensions).*?" -t:""path":"%firefox2%\1"
复制代码
发现 第一条fr.exe 这条语句是可以成功替换的,但是第二条 fr.exe 则是替换失败,本帖的内容就是讨论第二条的执行问题,不知道原因在哪里?

请问,语句应该怎么修改?或者是否必须使用fr外的第三方命令工具,如果是其他第三方工具命令行内容该如何填写?

估计使用fr.exe( find - replace )的人不很多。如用“正则表达式”处理文档,建议使用gawk( http://bcn.bathome.net/tool/4.1.0/gawk.exe )或者sed( http://bcn.bathome.net/tool/4.8/sed.exe ),这2工具在网上的资料相对容易找到。如能更清晰列出处理前的文档及处理后的文档,并附修改说明,应该能有解决方案。

TOP

回复 2# hfxiang


    sed似乎不支持懒惰模式。

TOP

关键是把上上楼说的如能给出后面的内容给出来。
不管什么语言,正则表达式都是一个东西,最多有点细微差别
补充一句,把会影响通用性的反例加进去,以防写好后再返工

TOP


或者我换种提法,以【\\browser\\features】为基准,怎么向前匹配最近的一个【path】?如图所示,红色区域是我最终想匹配的内容。
为什么我这里懒惰匹配,还能匹配到最开头的【path】?
  1. (?<=path\"\:\").*?(\\\\browser\\\\features).*?
复制代码
  1. "path":"D:\\Firefox106\\Profiles\\extensions\\s3google@translator.xpi","path":"D:\\Firefox106\\browser\\features\\screenshots@mozilla.org.xpi"
复制代码

TOP

本帖最后由 hfxiang 于 2022-11-28 11:49 编辑

回复 5# kidzgy


   

下载gawk( http://bcn.bathome.net/tool/4.1.0/gawk.exe
执行
  1. gawk "{print gensub(/^.*\"path\":\"(.+\\\\browser\\\\features).+\".*$/,\"\\1\",\"g\")}" extensions.json>con
复制代码
结果
  1. D:\\Firefox106\\browser\\features
复制代码

TOP

回复 5# kidzgy


这样可以吗
  1. (?<=path\"\:\")[^,]+(\\\\browser\\\\features)
复制代码
【批处理在线视频分享】http://bbs.bathome.net/thread-31727-1-1.html
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html

我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。

TOP

回复 5# kidzgy


sed试试这样
  1. sed -r "s#\"path\".*:\x22([^\x22]+\\\\browser\\\\features).*#\1#" 1.txt > 2.txt
复制代码
【批处理在线视频分享】http://bbs.bathome.net/thread-31727-1-1.html
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html

我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。

TOP

回复 7# Batcher


    感谢解答!这个绝了,用逗号做分割。我有个疑问,假设分割的不是逗号,而是apple这个词组或某个句子,那么这个【[^,]+】应该怎么写?

TOP

既然是json文件,那就按json处理呢?不用正则应该可以,如有样本可以试一下

TOP

回复 10# terse

json样本
https://wwi.lanzoup.com/ifb2r0h3ap1c

TOP

要用到所谓的"零宽断言"才能实现,不知道 fr.exe 支不支持
在 UltraEdit 中,选替换
正则选
  1. ^.*?("path":(?:(?!"path":).)*\\\\browser\\\\features).*$
复制代码
替换为选 \1
正则勾选 Perl

TOP

本帖最后由 WHY 于 2022-12-15 10:44 编辑
  1. @echo off
  2. REM 替换 D:\\Firefox106 为当前脚本路径
  3. set "p=%~dp0"
  4. PowerShell "$arr = (gc -Literal '%~dp0extensions.json' -Enc UTF8 -ReadCount 0) -replace '(?<=\"path\":\")(?:(?!\"path\":\").)*(?=Profiles\\\\extensions|browser\\\\features)', '%p:\=\\%'; sc -Literal '%~dp0Result.json' -Value $arr -Enc UTF8"
  5. pause
复制代码
Test.ps1
  1. #替换 D:\\Firefox106 为当前当前脚本路径
  2. #需PowerShell v3.0及以上版本
  3. $MyPath = $MyInvocation.MyCommand.Path -replace '\\[^\\]+$', '\';
  4. $json = gc -Literal ($MyPath + 'extensions.json') -Raw -Enc utf8 | ConvertFrom-Json;
  5. forEach( $obj In $json.addons ){
  6.     $path = $obj.path -replace '^.*?\\(?=Profiles\\extensions|browser\\features)', $MyPath;
  7.     $obj.path = $path;
  8. }
  9. $json | ConvertTo-Json -Depth 10 | sc -Literal ($MyPath + 'Result.json') -Enc utf8;
复制代码

TOP

提取含browser\features\ 关键词的路径
  1. @if(0)==(0) @echo off
  2. set "file=extensions.json"
  3. set "s=\browser\features\"
  4. cscript.exe -NoLogo -E:JScript %0  "%file%" "%s%"
  5. PAUSE & exit/b
  6. rem 保存为ANSI文件
  7. @end
  8. function adoLoadText(filename, charset) {
  9.     stream = new ActiveXObject("ADODB.Stream");
  10.     stream.type = 2;
  11.     stream.charset = charset;
  12.     stream.open();
  13.     stream.loadFromFile(filename);
  14.     text = stream.readText(-1);
  15.     stream.close();
  16.     return(text);
  17. }
  18. var file = WSH.Arguments.Item(0);
  19. var jsontext =adoLoadText(file, "UTF-8");
  20. var obj = new Function("return" + unescape(jsontext))();
  21. var re = new RegExp(WSH.Arguments.Item(1).replace(/[.*+?^${}()|[\]\\]/g, "\\$&"));
  22. for (var k  in obj) {var arr = obj[k] }
  23. for (var i=0, len = arr.length;  i<len;i++) {
  24.       var path=arr[i]["path"]
  25.       if (re.test(path))  {WSH.Echo(path)}
  26. }
复制代码

TOP

回复  kidzgy


   

下载gawk(  )
执行结果
hfxiang 发表于 2022-11-28 09:46



   您好!这个似乎是搞错了,不是提取json的path路径哦,是还要针对 D:\firefox106 进行重置路径。不知道gawk能直接修改吗?

TOP

返回列表