Board logo

标题: [文本处理] 请教一个基础的正则替换问题 [打印本页]

作者: netdzb    时间: 2021-1-19 13:47     标题: 请教一个基础的正则替换问题

[98,1262]<0,244,0>垄<244,130,0>上<374,188,0>行<562,136,0>-<698,192,0>苏<890,188,0>小<1078,184,0>明

替换成 ===>
[98,1262]垄上行-苏小明

我在editplus用正则替换

<.?*> ===> 空
是贪婪模式,最后替换成只有一个“明”,我不知道非贪婪模式应该怎么写?

editplus要是通过了,我打算用python的正则跑。
作者: qixiaobin0715    时间: 2021-1-19 13:54

*?次序颠倒了吧
作者: netdzb    时间: 2021-1-19 14:05

回复 2# qixiaobin0715

的确是的,用的少,给记错了啊。
作者: qixiaobin0715    时间: 2021-1-19 14:14

好像有的书上叫做匹配优先和忽略优先。
作者: netdzb    时间: 2021-1-19 14:49

回复 4# qixiaobin0715

1-4位的数字正则替换怎么写

7    ===>  00007
27   ===>  00027
389  ===>  00389
4568 ===>  04568

遇到5位数字不做替换,应该怎么写正则?
作者: qixiaobin0715    时间: 2021-1-19 15:09

如果是纯数字的话,分两次替换:
^===>0000
^.*(\d{5})$===>\1
注意不能有6位以上的数字,否则取后5位。
作者: qixiaobin0715    时间: 2021-1-20 06:08

回复 5# netdzb
精确替换,分两次,效率要高一点:
查找项^\d{1,4}$替换项0000\0
查找项^0*(0\d{4})$替换项\1
作者: netdzb    时间: 2021-1-20 09:15

回复 7# qixiaobin0715

\0表示什么意思?
作者: qixiaobin0715    时间: 2021-1-20 09:21

整个查找项匹配的内容
作者: qixiaobin0715    时间: 2021-1-20 09:22

如果不支持的话修改为:
查找项^(\d{1,4})$替换项0000\1
作者: cutebe    时间: 2021-1-21 14:07

本帖最后由 cutebe 于 2021-1-21 14:10 编辑
[98,1262]<0,244,0>垄<244,130,0>上<374,188,0>行<562,136,0>-<698,192,0>苏<890,188,0>小<1078,184,0>明
  1. sed -r "s/\[[0-9,]*\]|<[0-9,]*>//g" 电子书.txt
复制代码
垄上行-苏小明

1-4位的数字正则替换怎么写

7    ===>  00007
27   ===>  00027
389  ===>  00389
4568 ===>  04568
12345
遇到5位数字不做替换,应该怎么写正则?
  1. sed -r "s/^[0-9]{1,4}/0000\0/;s/^0+([0-9]{5,5})/\1/" 0.txt
复制代码
00001-4位的数字正则替换怎么写

00007    ===>  00007
00027   ===>  00027
00389  ===>  00389
04568 ===>  04568
12345
遇到5位数字不做替换,应该怎么写正则?





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2