找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 24143|回复: 2

[代码合集] 批处理怎样批量读取网页中超链接的文字部分生成列表?

[复制链接]
发表于 2012-5-21 00:23:36 | 显示全部楼层 |阅读模式
比如 有很多页(假设就10页吧)也可能更多

http://www.xxx.xxx/folder-2416253-n-a-1
http://www.xxx.xxx/folder-2416253-n-a-2
http://www.xxx.xxx/folder-2416253-n-a-3
http://www.xxx.xxx/folder-2416253-n-a-4
http://www.xxx.xxx/folder-2416253-n-a-5
http://www.xxx.xxx/folder-2416253-n-a-6
http://www.xxx.xxx/folder-2416253-n-a-7
http://www.xxx.xxx/folder-2416253-n-a-8
http://www.xxx.xxx/folder-2416253-n-a-9
http://www.xxx.xxx/folder-2416253-n-a-10
有规律的最后一位不同
而每个页面都有很多超链接
<li class='filename1' ><a href='/down_2697704.html' target='_blank'>【10+10】【高清蓝光1280版BD-RMVB国语中字】【2012最新舒淇桂纶镁剧情大片】.zip</a></li>

<li class='filename1' ><a href='/down_2710923.html' target='_blank'>【96分钟】【高清BDRIP-RMVB中字】【2011最新美国惊悚大片】.zip</a></li>
【10+10】【高清蓝光1280版BD-RMVB国语中字】【2012最新舒淇桂纶镁剧情大片】.zip
【96分钟】【高清BDRIP-RMVB中字】【2011最新美国惊悚大片】.zip
我只想提取这10个页面里超链接的文字部分
最后导出到一个ok.txt
这个怎么写好
发表于 2012-5-21 23:41:13 | 显示全部楼层
大概思路

用WGET 或者curl 保存网页 并更改为txt

findstr 提取文本关键词<li class='filename1' ><a href='/down_2697704.html' target='_blank'>【10+10】【高清蓝光1280版BD-RMVB国语中字】【2012最新舒淇桂纶镁剧情大片】.zip</a></li>导出到a.txt

  1. @echo off
  2. for /f "tokens=3 delims=><" %%i in (a.txt) do echo %%i>>ok.txt
复制代码
 楼主| 发表于 2012-5-22 01:08:20 | 显示全部楼层
谢谢 这个思路 很不错
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 06:04 , Processed in 0.016883 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表