[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]批处理怎样从文本中提取出某字符后N个字符的内容?

本帖最后由 ebookhome 于 2012-10-18 16:38 编辑

有一个文本文件,名字1.txt 里面存放的是网页源代码
我想用批处理来从这文本文件中,提取出包含某些内容的链接,然后把这些链接写入新的.txt
这些链接有一个特性,就是长度相同,都为60个字符
拿论坛来举例个例子,比如我要提取文本中包含"http://www.bathome.net"的链接
长度从链接的h开始算起,向后数60个字符,这样应该怎么操作呢?
请高手帮忙看一下,多谢了
1

评分人数

    • Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

本帖最后由 tmplinshi 于 2011-7-25 14:09 编辑

只提取每行第一个链接:(1 个中文字符算 2 个字符)
  1. sed -r -n "s|.*(http://www\.bathome\.net.{38}).*|\1|p" 1.txt >url60.txt
复制代码
1

评分人数

TOP

回复 2# tmplinshi
感谢版主帮忙

刚刚下载测试了一下,好像有点小问题
运行后,生成的url60.txt是空文件,什么也没有

现上传了一个源代码txt文件,请版主帮忙在测试一下.多谢版主,辛苦了

TOP

本帖最后由 tmplinshi 于 2011-7-25 14:41 编辑

我这里的运行结果:
http://www.bathome.net/uc_server/avatar.php?uid=33390&size=m
http://www.bathome.net/uc_server/avatar.php?uid=33065&size=m
http://www.bathome.net/uc_server/avatar.php?uid=33390&size=m
http://www.bathome.net/uc_server/avatar.php?uid=33065&size=m


sed 下载:
http://www.pement.org/sed/gsed407x.zip

TOP

回复 4# tmplinshi


    感谢版主

帮来是我这里没有sed,呵呵

TOP

返回列表