[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]求助批处理采集豆瓣读书书籍短评

求助大神,豆瓣读书书籍短评的采集

比如这个链接:
https://book.douban.com/subject/1023045/comments/

万分感谢大神!!!

你是要采集这个页面上的所有评论?
保存为txt还是html还是xml还是doc?
jyswjjgdwtdtj 发表于 2023-5-24 18:15


是的,就是书籍的所有评论,txt就行,您怎么方便都可以的,感谢大神的帮忙

TOP

terse 发表于 2023-5-24 20:10



    您好,terse大神,万分感谢您的应助,这个应该怎么用,我不太会,还请详细指教!!谢谢!

TOP

典型的粗制滥造脚本
输入最后面带有/的啊
比如
放进vbs文件
楼上那个只能搞一页
jyswjjgdwtdtj 发表于 2023-5-24 20:18

您好,感谢您的vbs,我测试了下,TXT是可以导出的,
但是复制地址后,点击确定,出现这个提示,
行:22
字符:1
错误:没有权限:“children”
代码:800A0046
源:Microsoft VBScript 运行时错误
不知道是什么问题?您看看,是我操作问题吗?

TOP

本帖最后由 tbjx138 于 2023-5-24 20:52 编辑
回复  tbjx138


    啊啊啊 我比较懒 评论导出完之后用错误来结束进程
能导出就行 不要在意这些细节: ...
jyswjjgdwtdtj 发表于 2023-5-24 20:44



    好的,能导出的,我以为我哪里弄得不对呢,
对于那个没有登录只能看220条的问题,这个我还真不知道,还是大神厉害,能看到问题本质
我一会测试一下。
再次感谢jyswjjgdwtdtj大神帮忙!!!

TOP

回复  tbjx138


    欸欸欸 220条是那位buyiyang说的
jyswjjgdwtdtj 发表于 2023-5-24 21:38



    对对,我刷新时没有看到上面的buyiyang朋友回帖,说声抱歉了

TOP

典型的粗制滥造脚本
输入最后面带有/的啊
比如
放进vbs文件
楼上那个只能搞一页
jyswjjgdwtdtj 发表于 2023-5-24 20:18


jyswjjgdwtdtj大神您好,感谢你的热心应助,我还请求您帮我一个忙,还是豆瓣的,
就是原文摘录,这一项我也想采集一下
https://book.douban.com/subject/1023045/blockquotes
还请大神帮忙看看!!先谢谢了!!

TOP

回复  tbjx138


4楼代码这样执行试试:
Batcher 发表于 2023-5-24 22:28


感谢管理员的回复,按照链接看了一下,没有太明白操作 我很菜,只能弄些简单的。

TOP

回复  tbjx138
保存为bat文件运行
如果要用户名 时间之类的 把‘comment-content’ 换为 ‘comment’
terse 发表于 2023-5-25 08:26

感谢terse大神,热心应助,
按照代码操作可以导出220条了,
反馈一下测试
如果要用户名 时间之类的 把‘comment-content’ 换为 ‘comment’
这个换了后没有反应,还是和之前导出一样。

TOP

回复  tbjx138
怎么回事呢,没有改动的话应该不会出现你说的问题
terse 发表于 2023-5-25 09:30



    没有改动其他,按照你说的操作的,不知道什么原因,还有就是我的ie浏览器不能登录豆瓣

TOP

这样运行后 查看两个文件的内容一样吗回复  tbjx138
terse 发表于 2023-5-25 10:58



    感谢terse大神耐心回复,还是没有改变,可能是我的原因吧。就这样吧,能导出就行了,再次谢谢大神了

TOP

回复  tbjx138


    略微改了一下就是爬原文摘录的
也要加上/
jyswjjgdwtdtj 发表于 2023-5-25 18:02


感谢jyswjjgdwtdtj大神的再次相助,已经可以导出原文摘录了,万分感谢!!!

TOP

返回列表