注册
登录
论坛
搜索
帮助
导航
私人消息 (0)
公共消息 (0)
论坛任务 (0)
系统消息 (0)
好友消息 (0)
帖子消息 (0)
批处理之家
»
有偿求助
» 【完结】求网页信息抓取+150元
[新手上路]
批处理新手入门导读
[视频教程]
批处理基础视频教程
[视频教程]
VBS基础视频教程
[批处理精品]
批处理版照片整理器
[批处理精品]
纯批处理备份&还原驱动
[批处理精品]
CMD命令50条不能说的秘密
[在线下载]
第三方命令行工具
[在线帮助]
VBScript / JScript 在线参考
返回列表
发帖
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
1
楼
跳转到
»
倒序看帖
打印
字体大小:
t
T
发表于 2021-9-30 11:02
|
显示全部帖子
【完结】求网页信息抓取+150元
本帖最后由 lxh623 于 2021-10-10 17:40 编辑
两个网站。各150元。
第一,
https://www.km.com/tv/---.html
全部电视剧。名称前面加TTT。
图片地址
【概览】(添加文字)
剧情介绍之前的内容。包括导演、得分等七八项。剧情最后要展开。这里的演员表不要,因为下面有。
【分集剧情】
【演员表】每一个演员人名加ZZZ。
【人物介绍】
【幕后信息】左右栏目,麻烦转行。
第二、
https://www.tvsou.com/class/dianshiju/
全部电视剧。名称前面加TTT。
图片地址
【概览】(添加文字)
这里的演员表不要,因为下面有。
【分集剧情】
剧情介绍+分集剧情
【演员表】每一个演员人名加ZZZ。
也可以我事先得到所有电视剧链接。按照文本去打开。
不知道会不会拦截,但愿没有。
我不会用于建网。
谢谢!
收藏
分享
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
2
楼
发表于 2021-10-1 08:01
|
显示全部帖子
5楼只有标题,而且放弃了。
欢迎大家继续。
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
3
楼
发表于 2021-10-4 15:46
|
显示全部帖子
本帖最后由 lxh623 于 2021-10-4 16:01 编辑
回复
8#
went
如果我把所有电视剧网址写入文本a,再一个一个获取,可能更好。
【概览】里面的“主演”不要了,因为后面有演员。
【分集剧情】包括剧情介绍(展开)和每一集剧情,暂时没有抓取。
谢谢!
有些演员那里没有转行。
比如,ZZZ车梓茗 饰演 :齐贵田玲 饰演 牛兰花张宛庭 饰演 孙桂琴闫锐 饰演 马志刚王超 饰演 李天洋
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
4
楼
发表于 2021-10-4 18:29
|
显示全部帖子
本帖最后由 lxh623 于 2021-10-4 18:32 编辑
回复
11#
went
麻烦增加【人物介绍】几个字。
麻烦查收。
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
5
楼
发表于 2021-10-5 09:45
|
显示全部帖子
麻烦做一下补充批处理。50元。
文本b,写入名字,一行一个。到
https://www.tvmao.com/
搜索,得到链接,打开,获取分集剧情。
格式
TTT
第1集
........
第2集
.......
谢谢!
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
6
楼
发表于 2021-10-7 10:19
|
显示全部帖子
本帖最后由 lxh623 于 2021-10-7 10:24 编辑
补充批处理。100元。
文本c,写入名字,一行一个。(与文本b一样)
到
https://www.tvmao.com/
搜索,得到链接,打开,获取人物关系图。没有就算了。
格式
TTT凤弈YYY人物关系图:
http://XXXXXXXXXX.png
有些png后面有东西。就是整个链接。比如,guanxitu/L74pL7=rL-.png?1
谢谢!
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
7
楼
发表于 2021-10-8 09:56
|
显示全部帖子
本帖最后由 lxh623 于 2021-10-8 09:59 编辑
11楼的代码,我下载了35000左右。
但是,还是不全,因为目录抓取不全。
如果文本输入构造的剩余网址65000,希望得到:网址+TTT标题。(网站自己有重复,同一个名字对应两个网址。另一方面,可能构造网址对应无效。)
这样,可以与35000对比,没有的标题对应的网址,再来抓取。
50元。
谢谢!
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
8
楼
发表于 2021-10-8 15:59
|
显示全部帖子
回复
19#
lxh623
这个我简单修改原来的批处理,居然完成。
谢谢!
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
9
楼
发表于 2021-10-10 09:44
|
显示全部帖子
回复
15#
went
能不能做一个根据链接提取分集剧情的。因为有些搜索结果是多个。50元。
谢谢!
TOP
lxh623
发短消息
加为好友
lxh623
当前离线
UID
7033
帖子
378
精华
0
积分
761
PB
755
技术
2
捐助
0
阅读权限
40
在线时间
203 小时
注册时间
2008-11-24
最后登录
2024-1-27
中尉
帖子
378
积分
761
技术
2
捐助
0
注册时间
2008-11-24
10
楼
发表于 2021-10-10 17:40
|
显示全部帖子
回复
22#
went
新帖子。
TOP
返回列表
批处理专区: BAT CMD DOS
BAT求助&讨论
BAT教程&资料
BAT原创&转载
BAT新大陆
BAT转载代码
新手练功
出题挑战
有偿求助
第三方命令行
开源原创工具
iBAT
Take Command
其他脚本区
PowerShell求助&讨论
PowerShell教程&资料
PowerShell原创&转载
VBS求助&讨论
JS / JScript / JavaScript
VBS教程&资料
VBS原创&转载
UNIX/Linux Shell
Python
Perl
网络资源区
电脑技术研讨
精品软件交流
论坛事务区
站务交流
意见反馈
论坛公告
版主申请
交换链接
建站杂谈
活动专区
论坛总版规
[收藏此主题]
[关注此主题的新回复]
[通过 QQ、MSN 分享给朋友]