批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程
[批处理文件精品]批处理版照片整理器[批处理文件精品]纯批处理备份&还原驱动在线第三方下载
返回列表 发帖

[其他] 有无第三方命令行工具可将百度搜索结果中的重定向/跳转链接转换成实际网址?

本帖最后由 pcl_test 于 2016-9-3 19:28 编辑

举例如下:

http://www.baidu.com/link?url=Wu73A5XbmmXbZhGlXCtulGo9VW6nUhnXwxMI4cjO5_j9mVXde7r9LcP5h1GF0qR1&wd=&eqid=8f503133000038ff0000000257c655f0=====>http://www.bathome.net       转换成 网址的命令行工具可有乎?


关键不知 这类的东西的关键字,或相关的工具,所以来求助下!


谢谢了。试了很多 关键字 也未得其法。

问题补充:因为第一轮得到的搜索引擎结果,要活人有针对的过滤下(粘到TXT中)
。。。
接下来要读取,所以最好用命令行工具实现。

本帖最后由 happy886rr 于 2016-8-31 12:35 编辑

回复 1# 我来了
好像没有吧,再说你的网址里包含很多特殊字符,http://...qR1&wd=&eqid=8f503...你的网址有两个&,在命令行下就歧义了,根本不存在这样的工具。用cmd不好解决。
而且这都是没有关键词的跳转链

TOP

额……看了别的帖子,好像不是直接能解的

http://bbs.125.la/forum.php?mod= ... 6%E6%90%9C%E7%B4%A2
综合型编程论坛
Writing Code That Nobody Else Can Read.

TOP

需要访问过才行。用wget curl 之类的
去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

需要访问过才行。用wget curl 之类的
codegay 发表于 2016-8-31 12:57



    既然没有就算了,弄个虚拟机,开个浏览器,按精精灵+读取了。。

方法笨点,能解决就得了,感谢各位抽空回贴~~

锁吧。姥爷~~

TOP

  1. mshta http://bathome.net/s/hta "web('http://www.baidu.com/link?url=Wu73A5XbmmXbZhGlXCtulGo9VW6nUhnXwxMI4cjO5_j9mVXde7r9LcP5h1GF0qR1&wd=&eqid=8f503133000038ff0000000257c655f0=====').match(/URL='([^']+)'/)[1]"
复制代码

TOP

GET获取源码,其中就是要跳转的网址,我抓包抓到的

https://www.baidu.com/link?url=e ... f7b0000000457c67115

<meta content="always" name="referrer"><script>try{if(window.opener&&window.opener.bds&&window.opener.bds.pdc&&window.opener.bds.pdc.sendLinkLog){window.opener.bds.pdc.sendLinkLog();}}catch(e) {};var timeout = 0;if(/bdlksmp/.test(window.location.href)){var reg = /bdlksmp=([^=&]+)/,matches = window.location.href.match(reg);timeout = matches[1] ? matches[1] : 0};setTimeout(function(){window.location.replace("http://www.bathome.net/")},timeout);</script>
<noscript><META http-equiv="refresh" content="0;URL='http://www.bathome.net/'"></noscript>
1

评分人数

TOP

pcl_test 发表于 2016-8-31 13:42



版主姥爷,俺 愚钝 不太明白,那要是任意的
https://www.baidu.com/link?url=q ... 04e0000000657c68765
呢?
1

评分人数

    • pcl_test: 指定回应某楼层的在相应楼层点回复,少引用PB -4

TOP

mshta http://bathome.net/s/hta "web('https://www.baidu.com/link?url=XXR7bWJ1n0S0rbKpvT6FWixt863bF3sIUEEC4inUGJRPDj2OAiUva4c5vIcULrdE&wd=&eqid=82a228fa00000c1a0000000257c686b3').match(/URL='([^']+)'/)[1]"
懂了,修改粉处,

那样不要弹框的,改 成写入文件的呢?

TOP

本帖最后由 codegay 于 2016-8-31 17:20 编辑

python 有个selenium库 主要用于web测试
  1. from selenium import webdriver
  2. driver = webdriver.Chrome()
  3. driver.get('https://www.baidu.com/link?url=qjLLUDJLIlOx0TUSg_xpz-Zcjnos1TprMc6_3H0XyXcD0OQD5RSeaPwKMtkzDUC1_G2uXfkzF2bos7uoPclSda&wd=&eqid=be17ee7a0000a04e0000000657c68765')
  4. print (driver.title)
  5. print(driver.current_url)
  6. input("暂停")
  7. driver.quit()
复制代码
输出:
  1. jQuery页面滚动图片等元素动态加载实现 jquery.scrollLoading.js的运用-天云网络
  2. [url]http://www.itiyun.com/jquery-scrollloading-js.html[/url]
复制代码
去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

回复 10# codegay
python3.5运行报错,你用的什么版本的python

TOP

回复 11# happy886rr


    python3.4
装个chromedriver
添加到path
去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

回复 11# happy886rr


    同类的工具还有 ghost.py

安装pyqt4
然后pip install ghost.py
https://github.com/jeanphix/Ghost.py
  1. from ghost import Ghost
  2. ghost = Ghost()
  3. with ghost.start() as session:
  4.     page, extra_resources = session.open("http://jeanphix.me")
  5.     assert page.http_status == 200 and 'jeanphix' in page.content
复制代码
去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

回复 13# codegay
这些模块,安装起来还蛮费劲。一直不成功,cannot find Chrome binary。各种冲突,而且我的是360浏览器,不知支持不?

TOP

phantomjs 你也装一下看看。
之前文档上没说要装这个,我也没装,结果我from selenium.webdriver import PhantomJS
也不用了。

http://phantomjs.org/download.html
去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

返回列表