- 帖子
- 2
- 积分
- 17
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2010-7-22
|
[文本处理] [已解决]批处理从多个html文件中提取特定内容组成新的文本文件
菜鸟求助
我想做一个批处理,要从一个指定存放html文件的目录中中提取html内特定字符到一个新的txt文件中;html中如下内容:
1.html内容:
<div style="text-align:center;"><h1>此处文字一</h1></div>
<div id=content_nei>
<center>
<div class="play" id="playlist">
<!--片头广告加载开始-->
<p id="loading1" style="z-index:1000"><iframe MARGINWIDTH=0 MARGINHEIGHT=0 HSPACE=0 VSPACE=0 FRAMEBORDER=0 SCROLLING=no src="loading.html" tppabs=".../template/x_skin9_b/images/g_js/loading.html" width="720" height="480" id="loading11"></iframe></p>
<i id="loading2" style="display:none; "><script>play_qvod_1('qvod://362593782|E10FD12282EBD0624FDE29B99FFF570B25BA83D8|2137215 00.rmvb|',w_qvod_w_1,w_qvod_h_1)</script></i>
<!--片头广告加载结束-->
2.html内容:
<div style="text-align:center;"><h1>此处文字二</h1></div>
<div id=content_nei>
<center>
<div class="play" id="playlist">
<!--片头广告加载开始-->
<p id="loading1" style="z-index:1000"><iframe MARGINWIDTH=0 MARGINHEIGHT=0 HSPACE=0 VSPACE=0 FRAMEBORDER=0 SCROLLING=no src="loading.html" tppabs=".../template/x_skin9_b/images/g_js/loading.html" width="720" height="480" id="loading11"></iframe></p>
<i id="loading2" style="display:none; "><script>play_qvod_1('qvod://337781456|114E4002F84E2F770439F66ACA97B16E4E21A495|0601-2_6Hello Titty 4 Part.1.rmvb|',w_qvod_w_1,w_qvod_h_1)</script></i>
<!--片头广告加载结束-->
我要实现生成一个新的txt文本,文本显示内容如下:
此处文字一 qvod://362593782|E10FD12282EBD0624FDE29B99FFF570B25BA83D8|2137215 00.rmvb|
此处文字二 qvod://337781456|114E4002F84E2F770439F66ACA97B16E4E21A495|0601-2_6Hello Titty 4 Part.1.rmvb|
差不多就是这样
一、提取附件html文件中 <h1> 到</h1> 之间的文字.《其中包含<h1>、</h1>》
二、再提取 qvod:// 到 rmvb| 之间的字符.《其中包含qvod:// 、rmvb|》
三、将提取内容写入一个新的文本中,文本内容如下:
<h1>屋頂也瘋狂</h1> qvod://129082483|0F025A9B1B48516D9DB4CD54162CFF4CE5338132|2137215屋頂也瘋狂.rmvb|
特别说明:我要在同一目录下对多个html文件执行提取操作
[ 本帖最后由 liujun409534709 于 2010-7-25 22:45 编辑 ] |
|