批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程
[批处理文件精品]批处理版照片整理器[批处理文件精品]纯批处理备份&还原驱动在线第三方下载
返回列表 发帖

[问题求助] 求教两个字符串之间内容命名文件名

我有一堆.html文件都是以数字命名,但不规则。我要以里面<title>...</title>的内容为html文件名,若用bat写经常出现响应错误,里面东西都没了。还有用vbs的话replace不支持通配符,该咋弄。

本帖最后由 ivor 于 2019-3-9 21:06 编辑
  1. @Powershell "& {[ScriptBlock]::Create("'#' + (gc '%~f0' -raw)").Invoke()}" & pause & goto :eof
  2. dir *.html | %{ren $_.Name ([regex]::Replace(([regex]::Match((gc $_),'(?<=<title>).*(?=</title>)').Value),'[\\/:*?\"<>|]',"")+$_.Extension)}
复制代码
已经过滤了特殊字符

TOP

我试了,提示无效字符。

TOP

  1. @echo off
  2. powershell -nologo -noprofile -command "foreach( $file in ( dir *.html -r ) ){([regex] '<title>(.*)</title>').Match( (type $file -ReadCount 0)).Groups[1]|foreach-object{ren -Path $file -NewName  \"$($_.Value).html\"}}"
复制代码
QQ 33892006

TOP

本帖最后由 jieyuan_1981 于 2019-3-9 22:22 编辑

回复 4# yhcfsr


    谢谢你的回答,但提示语句未结束。

TOP

已经过滤了特殊字符

TOP

回复 6# ivor


   
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

TOP

本帖最后由 jieyuan_1981 于 2019-3-9 22:16 编辑

回复 2# ivor


    我在本论坛看了几篇无效字符的帖子,好像是关键字或赋值方法的问题,还有是vba代码不能用在vbs中。比如:open Filename 就不行,open就行。你给我的答案是不是这块有问题。另外我是xp系统,是否不识别。

TOP

我们给的都是批处理代码,你放到vbs里面肯定不能运行了
加我qq250193966,帮你看看

TOP

本帖最后由 523066680 于 2019-3-9 22:44 编辑

即使是XP,涉及HTML解析的问题仍然建议换别的语言工具(lua, python, ahk, 什么都好,lua还能转exe呢)。
提取 <title> 示例
  1. use Mojo::DOM;
  2. use File::Slurp;
  3. grep { printf "%s %s\n", $_, Mojo::DOM->new(read_file $_)->at("title")->text } glob "*.html";
复制代码
综合型编程论坛
Writing Code That Nobody Else Can Read.

TOP

  1. '代码可用,扫码头像,随意赞助;有什么问题,可加QQ956535081及时沟通
  2. If LCase(Right(WSH.FullName,12)) = "\wscript.exe" Then
  3.     CreateObject("WScript.Shell").Run "cmd /c cscript.exe -nologo """ & WSH.ScriptFullName & """&pause&exit"
  4.     WSH.Quit
  5. End If
  6. Set fso=CreateObject("Scripting.FileSystemObject")
  7. RootPath=fso.GetFile(WSH.ScriptFullName).ParentFolder.Path
  8. arr=split("\ / : * ? \ "" < > | " & Chr(9)," ")
  9. getfile RootPath
  10. Function getfile(path)
  11.     Set oFolder=fso.GetFolder(path)
  12.     Set oSubFolders=oFolder.SubFolders
  13.       
  14.     Set oFiles=oFolder.Files
  15.     For Each oFile In oFiles
  16.         ext=fso.GetExtensionName(oFile.Path)
  17.         If Lcase(ext) = "html" Or Lcase(ext) = "htm" Then
  18.             text=gethtml(oFile.Path)
  19.             title=gettitle(text)
  20.             NewName=title & "." & ext
  21.             WSH.echo oFile.Path & " --> " & NewName
  22.             If title <> "" Then
  23.                 If Not fso.FileExists(oFile.ParentFolder.Path & "\" & NewName) Then
  24.                     oFile.Name=NewName
  25.                 Else
  26.                     WSH.echo "文件重名"
  27.                 End If
  28.             End If
  29.         End If
  30.     Next
  31.       
  32.     For Each oSubFolder In oSubFolders
  33.         getfile(oSubFolder.Path)
  34.     Next
  35.     Set oFolder=Nothing
  36.     Set oSubFolders=Nothing
  37. End Function
  38. Function gethtml(ByVal htmlfile)
  39.     htmltext=""
  40.     Set ado=CreateObject("ADODB.Stream")
  41.     ado.Type=2
  42.     '注意html文件的编码,如果是gbk或gb2312,修改下面的"utf-8"为"gb2312"
  43.     ado.Charset="utf-8"
  44.     ado.Open
  45.     ado.LoadFromFile htmlfile
  46.     ado.Position=0
  47.     htmltext=ado.ReadText
  48.     ado.Close
  49.     Set ado=Nothing
  50.     gethtml=htmltext
  51. End Function
  52. Function gettitle(ByVal htmltext)
  53.     htmltitle=""
  54.     Set regex=New RegExp
  55.     regex.Pattern="<title>(.+?)<\/title>"
  56.     regex.IgnoreCase=True
  57.     regex.Global = True
  58.     Set matches=regex.Execute(htmltext)
  59.     If matches.Count = 1 Then
  60.         htmltitle=matches(0).SubMatches(0)
  61.         For i=0 To Ubound(arr)
  62.             htmltitle=replace(htmltitle,arr(i),"_")
  63.         Next
  64.     End If
  65.     Set regex=Nothing
  66.     gettitle=htmltitle
  67. End Function
复制代码
提供代写,省时省力省事,支付宝扫码头像支付,QQ956535081

TOP

回复 11# zaqmlp


    谢谢你的是正确答案,但确实编码要改我的是ansi。

TOP

返回列表