批处理之家's Archiver

wewe-b 发表于 2012-2-8 07:38

[已解决]如何用BAT或VBS脚本提取网页中的字符串?

请教如何用 VBS 或 BAT 在以下网页中以 [color=Red]IP:端口[/color] 的格式提取出来保存到 TXT 中??

http://www.51proxied.com/http_fast.html

lvsehuaxue 发表于 2012-2-8 12:41

222.88.95.66:8080
222.88.95.66:80
218.80.232.38:8080
221.186.173.1:8080
221.130.162.48:82
112.175.227.204:8080
61.19.127.131:8080
222.88.95.77:80
222.88.95.65:8080
222.88.95.65:80
222.66.88.205:80
222.127.106.89:3128
221.7.159.224:8080
221.224.20.210:8080
221.130.162.48:85
221.130.162.48:84
221.130.162.48:81
221.130.162.48:80
159.226.168.11:80
193.53.4.252:8080
这是将网页中的内容粘贴到文本文件中处理的结果,不知道符合要求否?代码如下:[code]
@echo off&setlocal enabledelayedexpansion
    for /f "delims=" %%i in (a.txt) do (
    if !n!==1 echo !str!:%%i&set n=0
    echo %%i|findstr "^[1-9]*\.[0-9]*\.[0-9]*\.[0-9]*$">nul&&set /a n+=1&set "str=%%i"
)
pause
[/code]

ivor 发表于 2012-2-8 14:39

[code]@echo off
for /f "tokens=1-4" %%a in (ip.txt) do (
        >>ip1.txt echo %%b:%%c
)
pause[/code]代码简单化,copy1-30表格的内容到ip.txt

wewe-b 发表于 2012-2-8 15:57

谢谢楼上两位热心高手。
如果我想用 WGET 下载网页到本地,从 HTML 文件格式提取IP到TXT文本中。就是全自动化,不用打开网页浏览器就可完成。
请问  HTML 格式 IP 转 TXT 该怎么写?想过用 SED 和 AWK 。不过都不大好用。

ivor 发表于 2012-2-8 17:05

[i=s] 本帖最后由 ivor 于 2012-2-8 17:11 编辑 [/i]

[b]回复 [url=http://bbs.bathome.net/redirect.php?goto=findpost&pid=101772&ptid=15463]4#[/url] [i]wewe-b[/i] [/b][code]@echo off & setlocal ENABLEDELAYEDEXPANSION
set /p website=请输入网页:*.html                                                               
wget http://www.51proxied.com/%website%
(for /f "tokens=1,2 delims=>" %%a in ('findstr "<td" %website%') do (
        echo %%b
))>Temp
for /f "delims=<" %%c in (Temp) do (
        set /a count+=1
        if !count! equ 2 set ip=%%c
        if !count! equ 3 echo !ip!:%%c >>proxy.txt
        if !count! equ 4 set count=0
)
erase %website% Temp
pause

[/code]因为我还不知道wget如果指定保存的html文件名,所以不能做的太智能,有BUG再反馈吧,还可以优化,本人懒得很     呵呵,没问题就等后面的人继续发更优秀的来替代我这个  (*^__^*) 嘻嘻……

wewe-b 发表于 2012-2-8 20:15

[quote]回复  wewe-b 因为我还不知道wget如果指定保存的html文件名,所以不能做的太智能,有BUG再反馈吧,还可以优 ...
[size=2][color=#999999]ivor 发表于 2012-2-8 17:05[/color] [url=http://www.bathome.net/redirect.php?goto=findpost&pid=101775&ptid=15463][img]http://www.bathome.net/images/common/back.gif[/img][/url][/size][/quote]


    谢谢指点。代码可以实现自动化了。 又加深了对 For 和 Findstr 的了解.

find 发表于 2012-2-9 22:48

[b]回复 [url=http://www.bathome.net/redirect.php?goto=findpost&pid=101772&ptid=15463]4#[/url] [i]wewe-b[/i] [/b]


你还没学会sed和awk吧

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.