本帖最后由 slimay 于 2021-9-30 14:51 编辑
请到 http://cmd1152.ys168.com/ 文件区 下载 "lxh623已经提取好的资料.zip"
附赠 提取工具, 赠三种数据格式 ,txt, html, excel表格格式. 均是提取好的全部数据, 直接使用.无需加工- .. http://cmd1152.ys168.com/ 文件区 下载 "lxh623已经提取好的资料.zip"
- 七猫影视-提取.html
- 七猫影视-提取.xls
- 定制说明.txt
- 搜视网-提取.html
- 搜视网-提取.xls
- 文本格式
- 新站到-提取.html
- 新站到-提取.xls
- 附赠提取工具
复制代码 提取脚本,网址随便改, 理论上可提取任何网站- @echo off
- REM 设置提取网址
- set "url=https://www.tvsou.com/class/dianshiju/--"
- REM 设置网页数量
- set "num=100"
-
- REM 开始提起网页
- for /l %%a in (1,1,%num%) do (
- echo;正在下载 第 %%a 个页面
- curl "%url%--%%a" > home\%%a.txt
- echo;正在转码 第 %%a 个页面
- wincp home\%%a.txt -o ansi\N_%%a.txt -f 65001 -t 936
- )
-
- REM 直接输出提取后的信息
- (
- for /l %%a in (1,1,%num%) do (
- zq ansi\N_%%a.txt
- )
- ) > out.html
- pause
复制代码
|