找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 24568|回复: 3

[文本处理] [已解决]批处理如何在记事本或者htm里提取文本?

[复制链接]
发表于 2015-2-8 19:23:27 | 显示全部楼层 |阅读模式
我有n个htm网页文件,想提取出指定的文本,提取结果如下:

附上2个网页文件,请大神帮忙!!!批处理和vba都可以,谢谢!

评分

参与人数 1PB +2 收起 理由
Batcher + 2 感谢给帖子标题标注[已解决]字样

查看全部评分

 楼主| 发表于 2015-2-9 10:12:33 | 显示全部楼层
请大神帮忙!!
发表于 2015-2-9 12:59:46 | 显示全部楼层
  1. @set @n=0;/* & echo off
  2. echo,BKID,书名,作者,出版日期,出版社,ISBN>1.csv
  3. (for %%a in (*.htm) do (
  4.         cscript -nologo -e:jscript "%~0"<"%%a"
  5. ))>>1.csv
  6. pause & exit/b */

  7. txt = WScript.StdIn.ReadAll();
  8. re = />作者:[\s\S]+?word=.+?'/ig;

  9. s = "";
  10. while ((ar = re.exec(txt)) != null) {
  11.         s += ar[0].match(/bkid=(\d+)/i)[1] + ","
  12.         s += ar[0].match(/word=(.*?)'/i)[1] + ","
  13.         s += ar[0].match(/>作者:(.+?)</)[1] + ","
  14.         s += ar[0].match(/>出版日期:(.+?)</)[1] + ","
  15.         s += ar[0].match(/>出版社:(.+?)</)[1] + ","
  16.         s += ar[0].match(/>ISBN:(.+?)</i)[1] + "\r\n";
  17. }
  18. WScript.StdOut.Write(s)
复制代码

评分

参与人数 1技术 +1 收起 理由
tbjx138 + 1 乐于助人

查看全部评分

 楼主| 发表于 2015-2-9 13:28:29 | 显示全部楼层
回复 3# apang

感谢大神的帮忙,已经可以提取,大神的技术太牛了!!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 17:21 , Processed in 0.018746 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表