[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文件操作] 处理时效文件的批处理

本帖最后由 vomvcom 于 2012-4-14 00:42 编辑

遍历当前文件夹下包括子文件的.html文件.收集所有.jpg .gif 和.bmp 文件有关的字符串 一般都是在"" 双引号内. 导出到c.txt(批处理运行的时候输入指定网址,导出到c.txt时过滤网址改成/当前目录..)
然后搜索当前目录下包括子文件的所有.jpg .gif 和.bmp文件. 对比.c.txt. 如果有.就跳过.如果.没出现在.c.txt中.就按原来的路径剪切移动到 失效/ 目录下.

找一个html文件,压缩,传上来,让大家做测试。

TOP

  1.         <div class="date-tab"><span class="month">Jul</span><span class="day">18 </span></div>
  2.          <p><table border="0" cellspacing="0" cellpadding="0" width="92%">    <tbody>        <tr>            <td height="44" valign="bottom" align="center"><span class="title"><font color="#000000">高清图:</font></span></td>        </tr>        <tr>            <td height="8" background="http://www.sina.com/images/viewdocbj.jpg" align="center">&nbsp;</td>        </tr>        <tr>            <td height="38" align="center">&nbsp;</td>        </tr>        <tr>            <td align="left">            <div align="center">&nbsp;</div>            </td>        </tr>        <tr>            <td height="12" align="left">&nbsp;</td>        </tr>        <tr>            <td align="left"><span class="viewdoctitle">            <p align="center"><img border="0" alt="hao" src="http://www.sina.com/uploadfile/20100528/20100528165918386.jpg" /></p>            <p align="center">hao</p>            <p align="left">&nbsp;&nbsp;&nbsp; 天津美术学院院
  3. )</p>            </span></td>        </tr>    </tbody></table></p>
  4.       </div>
  5.       <div class="meta">hao</div>
  6.     </div>
  7.    
复制代码
肯定是src=" 开头.
后边
基本就是 http://开头 到  .jpg 或者.gif .bmp结尾
要么就是 / 开头  到  .jpg 或者.gif .bmp结尾

TOP

回复 3# vomvcom
  1. sed "/src=\"http:/!d; s/.*src=\"\(http:[^\"]\+\)\".*/\1/g" a.html
复制代码

TOP

我修改了要求. 之前提出的有问题.
因为如果是顶级域名的话.不改成本地路径肯定没法对比.

我运行了 gawk .你的代码 .没导出 文本文件...没反应...

TOP

回复 5# vomvcom


    可能是你没有sed

TOP

不是吧这一行复制到文本另存为.bat执行么?

TOP

回复 7# vomvcom


    不是,因为用的是sed命令,但是你没有。

TOP

那如何获得sed命令?

TOP

返回列表