[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 【更新了问题】如何用批处理实现自动下载网络视频?

原问题1.0:
喜欢在网络上看电视,比如 :央视的《环球财经连线》连接:http://cctv.cntv.cn/lm/huanqiucaijinglianxian/    (该地址每一期并不改变)

可是,央视不提供直接下载,于是转到第三方网站“硕鼠官网” www.flvcd.com/      

输入《环球财经连线》的地址就会得到其真实地址了:

  解析连接:  http://www.flvcd.com/parse.php?f ... t=%BF%AA%CA%BCGO%21

可以看到该视频被切分成了8段,通过近几期的观察,其中的规律就在于后面的1、2、3、4、5、6、7、8、不同,那么好了,下载不就可以批处理了吗?

http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-1.mp4
http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-2.mp4
http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-3.mp4
http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-4.mp4
http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-5.mp4
http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-6.mp4
http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-7.mp4
http://vod.cntv.lxdns.com/flash/ ... 000nero_aac32-8.mp4


那么问题来了?如何通过批处理实现运行命令自动下载当天的视频

最后再将8段视频重命名为    日期-01。。。日期-08的mp4.


感谢5楼terse完美地解决了该问题,同时让我看到了批处理更迷人的一面,谢谢!

------------------------------问题2.0------------------------华丽的分割线-------------------------------------------------------------------------

后来,我发现,从《环球财经连线》的地址http://cctv.cntv.cn/lm/huanqiucaijinglianxian/ 直接解析出现了问题:

因为,该节目一天中有“午间版”、“晚间版”两个版块,于是在上述地址页面中看到了如下代码:

2015.01.13午间版:http://jingji.cntv.cn/2015/01/13/VIDE1421126100885196.shtml
2015.01.12晚间版:http://jingji.cntv.cn/2015/01/13/VIDE1421105440961859.shtml     (也许央视网管程序管理有问题,日期不匹配)

http://cctv.cntv.cn/lm/huanqiucaijinglianxian 在硕鼠网上直接解析出来的是昨天晚上的视频,不是今天中午最新的

其实我想下载的是最近一期的(刚更新的一期2015.01.13午间版)就要用到   http://jingji.cntv.cn/2015/01/13/VIDE1421126100885196.shtml  这个地址。

而这个地址需要从上述http://cctv.cntv.cn/lm/huanqiucaijinglianxian/ 页面代码中提取,那么问题又来了:


如何在固定地址  http://cctv.cntv.cn/lm/huanqiucaijinglianxian/  中提取出最新一期视频连接,把该连接放到第三方网站“硕鼠官网” www.flvcd.com/  中解析出视频地址,最后再下载下来?

这样,就可以实现:在下午就可以下载当天的午间版;在深夜就可以下载当天的晚间版了;


感谢amwfjhh不厌其烦地、完美地解决了该问题,谢谢!


------------------------------问题3.0------------------------华丽的分割线-------------------------------------------------------------------------

再以上两问题实现的最后,又如何将8段视频合并成一个整体,MP4格式(或其它用批处理可以实现的方式)

话说,这个问题是不是有点儿难为批处理了? 呵呵。等待大牛出现。。。

可以暴力一点:
  1. @echo off
  2. set "年=%date:~0,4%"
  3. set "月=%date:~5,2%"
  4. set "日=%date:~8,2%"
  5. for /l %%a in (1 1 16) do down http://vod.cntv.lxdns.com/flash/mp4video38/TMS/%年%/%月%/%日%/aa7bf38105cc4efab5ccb038cd9903bc_h264418000nero_aac32-%%a.mp4   aa7bf38105cc4efab5ccb038cd9903bc_h264418000nero_aac32-%%a.mp4   2>nul
复制代码
这个 down 换成 wget curl 什么的也都行
down.exe 下载
支持http的文件下载工具 - Filedownloader
wget下载
curl下载

TOP

http://vod.cntv.lxdns.com/flash/mp4video38/TMS/2015/01/11/aa7bf38105cc4efab5ccb038cd9903bc_h264418000nero_aac32-1.mp4

红色字体部分每天是不一样的。

TOP

抛砖引玉
  1. wget -q "http://www.flvcd.com/parse.php?format=&kw=http%%3A%%2F%%2Fcctv.cntv.cn%%2Flm%%2Fhuanqiucaijinglianxian%%2F" -O - | sed "/下载地址:/!d; s/href=./\n/g" | sed "/http:/!d; s/. target=.*//" > 地址.txt
复制代码

TOP

也来一个 需下载外部 wget.exe
  1. @if(0)==(0) echo off
  2. CScript.exe -NoLogo -E:JScript %0 >$
  3. for /f "tokens=1*" %%i in ($) do wget -c -O %%i %%j
  4. del $ & pause & exit
  5. @end
  6. var url = "http://www.flvcd.com/parse.php?format=&kw=http%3A%2F%2Fcctv.cntv.cn%2Flm%2Fhuanqiucaijinglianxian%2F&sbt=%BF%AA%CA%BCGO%21"
  7. var xmlhttp=new ActiveXObject("Microsoft.XMLHTTP");
  8. xmlhttp.open("Get",url,false);
  9. xmlhttp.send();
  10. var html = new ActiveXObject("htmlfile");
  11. html.write(xmlhttp.responseText);
  12. var text = html.getElementsByTagName('a');
  13. var len = text.length;
  14. var date = new Date();
  15. var y = date.getFullYear();
  16. var m = (date.getMonth()+1)>9?(date.getMonth()+1):'0' + (date.getMonth()+1);
  17. var d=date.getDate()>9?date.getDate():'0' + date.getDate();
  18. var name = '' + y + m + d + '-'
  19. for (i=0; i<len; i++) {
  20.    if (text[i].onclick) {
  21.      var str = '' + text[i]
  22.      var filename = name + str.replace(/.+?([^ -]*)$/,'$1');
  23.      WScript.Echo(filename,str)
  24.    };
  25. };
复制代码

TOP

正则用得好,批量没烦恼……

TOP

回复 5# terse

这代码写的。。。。太赞了!!非常感谢!!

当然,没怎么看懂,对CScript 还很陌生,不过看到你的代码更觉得批处理这东西真的很赞!

请教一下:  

第2行: -E:JScript %0   部分应该如何理解?(只知道生成了以$命名的文件中,形成了下载列表)

第8行:  new ActiveXObject("Microsoft.XMLHTTP")    是不是所谓的创建XMLHttpRequset对象?不明白程序是如何运行的

第13行:.write(xmlhttp.responseText)       不明白


因为对CScript还很陌生,不知道要理解该程序还应该补习哪些知识(或者说是哪一方面),特此请教!

TOP

回复 7# 宫商角徵羽


VBS和JScript相关教程:
http://bbs.bathome.net/thread-13298-1-1.html
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

来一个纯脚本版的,只需要只支BAT与JScript,无需第三方wget或者Curl.
  1. @if (0)==(0) echo off
  2. setlocal enabledelayedexpansion
  3. cscript -nologo -e:jscript %~s0 GetWebContent "http://cctv.cntv.cn/lm/huanqiucaijinglianxian/" "$"
  4. set /a index=0
  5. for /f "delims=" %%i in ('cscript -nologo -e:jscript %~s0 GetRegStr "$" "<BR><a\shref='([^']+)'[^>]+>[^<]+</a>"') do (
  6. set /a index+=1
  7. echo,!index! : %%i
  8. CScript -nologo -E:jscript %~s0 DownloadFile "%%i" "%cd%\!index!.mp4"
  9. )
  10. :end
  11. pause & goto :EOF
  12. @end
  13. var fun = WScript.arguments(0);
  14. switch (fun){
  15. case "GetWebContent":
  16. if (WScript.arguments.length < 3) {
  17. WScript.Echo("参数个数错误");
  18. WScript.quit();
  19. }
  20. var url = WScript.arguments(1);
  21. var fil = WScript.arguments(2);
  22. GetWebContent(GetEncodeURIComponentStr(url), fil);
  23. break;
  24. case "DownloadFile":
  25. if (WScript.arguments.length < 3) {
  26. WScript.echo("参数个数错误");
  27. WScript.quit();
  28. }
  29. var url = WScript.arguments(1);// + "?wshc_tag=1&wsts_tag=54b5d817&wsid_tag=abd9364e&wsiphost=ipdbm";
  30. var fil = WScript.arguments(2);
  31. GetWebContent(url, fil);
  32. break;
  33. case "GetEncodeURIComponentStr":
  34. if (WScript.arguments.length < 2) {
  35. WScript.echo("参数个数错误");
  36. WScript.quit();
  37. }
  38. var url = WScript.arguments(1);
  39. GetEncodeURIComponentStr(url);
  40. break;
  41. case "GetFileContent":
  42. if (WScript.arguments.length < 2) {
  43. WScript.Echo("参数个数错误");
  44. WScript.quit();
  45. }
  46. var fil = WScript.arguments(1);
  47. GetFileContent(fil);
  48. break;
  49. case "GetRegStr":
  50. if (WScript.arguments.length < 3) {
  51. WScript.Echo("参数个数错误");
  52. WScript.quit();
  53. }
  54. var fil = WScript.arguments(1);
  55. var regStr = WScript.arguments(2);
  56. regStr = regStr.replace(/'/g, "\"");
  57. GetRegStr(fil, regStr);
  58. break;
  59. default:;
  60. }
  61. function GetEncodeURIComponentStr(URL){
  62. var encodeUrl = encodeURIComponent(url);
  63. var webUrl = "http://www.flvcd.com/parse.php?format=&kw="
  64. webUrl += encodeUrl;
  65. WScript.echo(webUrl);
  66. return webUrl;
  67. }
  68. function GetWebContent(url, fileName){
  69. try{
  70. var oHttp = new ActiveXObject("MSXML2.ServerXMLHTTP");
  71. oHttp.open("Get", url, false);
  72. WScript.echo("进入函数,传入参数为:" + url);
  73. oHttp.send("");
  74. if (oHttp.readyState == 4) {
  75. WScript.echo("内容获取完毕");
  76. //WScript.echo(oHttp.responseText);
  77. var oStream = new ActiveXObject("adodb.stream");
  78. oStream.Open();
  79. oStream.Type = 1;
  80. oStream.Write(oHttp.responseBody);
  81. oStream.Position = 0;
  82. var fso = new ActiveXObject("scripting.filesystemobject");
  83. if (fso.fileExists(fileName)) fso.deleteFile(fileName);
  84. oStream.SaveToFile(fileName);
  85. WScript.Echo("写入文件:" + fileName);
  86. oStream.close();
  87. } else {
  88. WScript.Echo("内容获取失败");
  89. }
  90. }catch (e){
  91. WScript.echo(e.message);
  92. }
  93. }
  94. function GetFileContent(fil){
  95. var oStream1 = new ActiveXObject("adodb.stream");
  96. oStream1.open();
  97. oStream1.charset = "GBK";
  98. oStream1.Type = 2;
  99. oStream1.LoadFromFile(fil);
  100. content = oStream1.ReadText();
  101. oStream1.Close();
  102. //WScript.Echo(content);
  103. return content;
  104. }
  105. function GetRegStr(fil, regStr){
  106. //WScript.echo("正则表达式内容 : " + regStr);
  107. var reg = new RegExp(regStr, "g");
  108. var content = GetFileContent(fil);
  109. var ret = "";
  110. while ((collection = reg.exec(content)) != null) {
  111. //WScript.echo("正则匹配成功");
  112. ret += collection[1] + "\r\n";
  113. //WScript.echo(collection[1]);
  114. }
  115. WScript.Echo(ret);
  116. return ret;
  117. }
复制代码

TOP

本帖最后由 宫商角徵羽 于 2015-1-14 18:15 编辑

回复 8# Batcher

我知道有这么些书(厚厚的书)可以参考,

不过,我想知道的是,在这么一堆东西里,关注哪部分内容可以理解本程序?

麻烦,能给圈一下重点,谢谢。(还有,这个程序是用到jscript,还是vbs,还是两个都有?)

TOP

本帖最后由 宫商角徵羽 于 2015-1-14 21:56 编辑

回复 9# amwfjhh
谢谢你的答复:

不过,后来,我发现用http://cctv.cntv.cn/lm/huanqiucaijinglianxian 在硕鼠网上直接解析出来的的视频,未必是最新的。

其实我想下载的是最近一期的(刚更新的一期2015.01.14午间版)就要用到   http://jingji.cntv.cn/2015/01/14/VIDE1421213038989792.shtml  这个地址。

而这个地址需要从上述http://cctv.cntv.cn/lm/huanqiucaijinglianxian/ 页面代码中提取,那么问题又来了:


如何在固定地址  http://cctv.cntv.cn/lm/huanqiucaijinglianxian/  中提取出最新一期视频连接,把该连接放到第三方网站“硕鼠官网” www.flvcd.com/  中解析出视频地址,最后再下载下来?

这样,就可以实现:在下午就可以下载当天的午间版;在深夜就可以下载当天的晚间版了;

(另,前面代码美中不足是:1、缺了个进度条;2、最后文件名不能按日期保存;3、代码显得多了一点,呵呵,谢谢)

TOP

回复 10# 宫商角徵羽


    我没有见过这样的书,如果你哪天找到了记得给我分享一下。
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

回复 11# 宫商角徵羽


    那只是提供一种解题思路,如何在不用第三方程序,仅靠微软的脚本便将之办到的情况,其实你说的问题都可以解决,代码写那么长也是为可扩展而那么写的,在BAT里面给几个页面的初始化变量,然后在JS脚本里面调用正则表达式,解析页面元素,下载相应内容。你说的要求,其实改一下初始页面,或者多几步解析页面的代码就可以了。至于按日期命名下载文件,就更不是事了……

TOP

本帖最后由 amwfjhh 于 2015-1-15 11:38 编辑

回复 11# 宫商角徵羽


    主体内容不变,只小改一下批处理中的调用即可达到你要的目的:
  1. @if (0)==(0) echo off
  2. setlocal enabledelayedexpansion
  3. echo,取得最新一期视频播放地址
  4. cscript -nologo -e:jscript %~s0 DownloadFile "http://cctv.cntv.cn/lm/huanqiucaijinglianxian/" "$"
  5. for /f "delims=" %%i in ('cscript -nologo -e:jscript %~s0 GetRegStr "$" "<a\shref='([^']+)'\starget='_blank'\stitle=''>[^<]+</a>"') do (
  6.   echo,%%i&echo,&echo,
  7.   set "strVideoUrl=%%i"
  8.   goto :next
  9. )
  10. :next
  11. echo,传入视频播放地址,获取分析结果
  12. cscript -nologo -e:jscript %~s0 GetWebContent "!strVideoUrl!" "$"
  13. echo,&echo,
  14. set /a index=0
  15. for /f "delims=" %%i in ('cscript -nologo -e:jscript %~s0 GetRegStr "$" "<BR><a\shref='([^']+)'[^>]+>[^<]+</a>"') do (
  16.   set /a index+=1
  17.   echo,!index! : %%i
  18.   CScript -nologo -E:jscript %~s0 DownloadFile "%%i" "%cd%\%date:~0,10%_!index!.mp4"
  19.   echo,&echo,
  20. )
  21. :end
  22. del /f $
  23. pause & goto :EOF
  24. @end
  25. var fun = WScript.arguments(0);
  26. switch (fun){
  27. case "GetWebContent":
  28.   if (WScript.arguments.length < 3) {
  29.     WScript.Echo("参数个数错误");
  30.     WScript.quit();
  31.   }
  32.   var url = WScript.arguments(1);
  33.   var fil = WScript.arguments(2);
  34.   GetWebContent(GetEncodeURIComponentStr(url), fil);
  35.   break;
  36.   
  37. case "DownloadFile":
  38.   if (WScript.arguments.length < 3) {
  39.     WScript.echo("参数个数错误");
  40.     WScript.quit();
  41.   }
  42.   var url = WScript.arguments(1);// + "?wshc_tag=1&wsts_tag=54b5d817&wsid_tag=abd9364e&wsiphost=ipdbm";
  43.   var fil = WScript.arguments(2);
  44.   GetWebContent(url, fil);
  45.   break;
  46.   
  47. case "GetEncodeURIComponentStr":
  48.   if (WScript.arguments.length < 2) {
  49.     WScript.echo("参数个数错误");
  50.     WScript.quit();
  51.   }
  52.   var url = WScript.arguments(1);
  53.   GetEncodeURIComponentStr(url);
  54.   break;
  55.   
  56. case "GetFileContent":
  57.   if (WScript.arguments.length < 2) {
  58.     WScript.Echo("参数个数错误");
  59.     WScript.quit();
  60.   }
  61.   var fil = WScript.arguments(1);
  62.   GetFileContent(fil);
  63.   break;
  64.   
  65. case "GetRegStr":
  66.   if (WScript.arguments.length < 3) {
  67.     WScript.Echo("参数个数错误");
  68.     WScript.quit();
  69.   }
  70.   var fil = WScript.arguments(1);
  71.   var regStr = WScript.arguments(2);
  72.   regStr = regStr.replace(/'/g, "\"");
  73.   GetRegStr(fil, regStr);
  74.   break;
  75.   
  76. default:;
  77. }
  78. function GetEncodeURIComponentStr(url){
  79.   var encodeUrl = encodeURIComponent(url);
  80.   var webUrl = "http://www.flvcd.com/parse.php?format=&kw="
  81.   webUrl += encodeUrl;
  82.   WScript.echo(webUrl);
  83.   return webUrl;
  84. }
  85. function GetWebContent(url, fileName){
  86.   try{
  87.     var oHttp = new ActiveXObject("MSXML2.ServerXMLHTTP.4.0");
  88.     oHttp.setProxy(1);
  89.     oHttp.open("Get", url, false);
  90.     WScript.echo("进入函数,传入参数为:" + url);
  91.     oHttp.send("");
  92.    
  93.     if (oHttp.readyState == 4) {
  94.       WScript.echo("内容获取完毕");
  95.       //WScript.echo(oHttp.responseText);
  96.       var oStream = new ActiveXObject("adodb.stream");
  97.       oStream.Open();
  98.       oStream.Type = 1;
  99.       oStream.Write(oHttp.responseBody);
  100.       oStream.Position = 0;
  101.       
  102.       var fso = new ActiveXObject("scripting.filesystemobject");
  103.       if (fso.fileExists(fileName)) fso.deleteFile(fileName);
  104.       
  105.       oStream.SaveToFile(fileName);
  106.       WScript.Echo("写入文件:" + fileName);
  107.       oStream.close();
  108.     } else {
  109.       WScript.Echo("内容获取失败");
  110.     }
  111.    
  112.   }catch (e){
  113.     WScript.echo(e.message);
  114.   }
  115. }
  116. function GetFileContent(fil){
  117.     var oStream1 = new ActiveXObject("adodb.stream");
  118.     oStream1.open();
  119.     oStream1.charset = "GBK";
  120.     oStream1.Type = 2;
  121.     oStream1.LoadFromFile(fil);
  122.    
  123.     content = oStream1.ReadText();
  124.     oStream1.Close();
  125.    
  126.     //WScript.Echo(content);
  127.     return content;
  128. }
  129. function GetRegStr(fil, regStr){
  130.   //WScript.echo("正则表达式内容 : " + regStr);
  131.   var reg = new RegExp(regStr, "g");
  132.   var content = GetFileContent(fil);
  133.   var ret = "";
  134.   
  135.   while ((collection = reg.exec(content)) != null) {
  136.     //WScript.echo("正则匹配成功");
  137.     ret += collection[1] + "\r\n";
  138.     //WScript.echo(collection[1]);
  139.   }
  140.   
  141.   WScript.Echo(ret);
  142.   return ret;
  143. }
复制代码

TOP

回复 14# amwfjhh

谢谢,非常感谢!!

不过,好像哪里出现问题了呢?

TOP

返回列表