Board logo

标题: [文本处理] 如何用BAT保存多个相似网页中链接的PDF [打印本页]

作者: qxdbat    时间: 2020-11-13 15:47     标题: 如何用BAT保存多个相似网页中链接的PDF

<div class="pdfDLLink"><a href="//jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf" target="_blank">ダウンロード (PDF)</a></div>
上面是其中一个网页的链接代码。
我想用BAT打开这个网页,
然后打开   //jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf   并且保存到本地,
名字为AAA.PDF,
其中不同的网页 TKA1_01/pdf/0013 这部分有变化(这个是主要的)

本人完全小白一个,只会些DOS命令,希望大高手给了BAT的编写代码 谢谢
作者: Batcher    时间: 2020-11-13 17:27

回复 1# qxdbat


    请给出网页地址。如果已经下载到本地,请选择1个htm文件打包压缩传上来。
作者: peterboy666    时间: 2020-11-13 17:39

回复 1# qxdbat

你去下个 WGet 就可以了.

C:\>WGet --no-check-certificate https://jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf
--2020-11-13 17:36:21--  https://jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf
Resolving jp.c.misumi-ec.com... 13.35.38.99
Connecting to jp.c.misumi-ec.com|13.35.38.99|:443... connected.
WARNING: cannot verify jp.c.misumi-ec.com's certificate, issued by `/C=US/O=Amazon/OU=Server CA 1B/CN=Amazon':
  Unable to locally verify the issuer's authority.
HTTP request sent, awaiting response... 200 OK
Length: 622420 (608K) [application/pdf]
Saving to: `0013.pdf'

100%[===========================================================================================================

2020-11-13 17:36:22 (4.03 MB/s) - `0013.pdf' saved [622420/622420]
作者: qxdbat    时间: 2020-11-16 09:02

回复 2# Batcher


https://jp.misumi-ec.com/vona2/detail/221000055825/

[attach]12893[/attach]
作者: Batcher    时间: 2020-11-16 10:17

回复 3# peterboy666


    楼主的问题可能侧重于如何在htm文件中找到pdf的下载地址
作者: wujunkai    时间: 2020-11-16 19:18

回复 4# qxdbat


    能把下载地址也给一下吗。我实在找不到 .pdf
作者: wujunkai    时间: 2020-11-16 19:29

我找到了,可惜电脑没带回来
这里给个思路

findstr找到有 openSubWindow 的那一行,其实有两行,随便哪一行都可以
然后提取里面的链接,这个需要比较强的功底
楼主给的例子里面提取的链接是
jp.c.misumi-ec.com/book/YKO1_02/digitalcatalog.html?page_num=85
下载地址是
jp.c.misumi-ec.com/book/YKO1_02/pdf/0085.pdf
关系一目了然




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2