找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 13784|回复: 1

[技术讨论] [分享]Powershell提取html网页标题,过滤后重命名html文件名

[复制链接]
发表于 2021-4-26 15:52:43 | 显示全部楼层 |阅读模式
本帖最后由 wxyz0001 于 2021-4-26 17:33 编辑

▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名:
573.html
688.html
741.html

html源文件里的标题<title>行:
<title>两幅油画的故事 - 读者文摘杂志(dzwzzz.com)</title>
<title>马克·扎克伯格的“脸谱” - 读者文摘杂志(dzwzzz.com)</title>
<title>戏比天大情比海深 - 读者文摘杂志(dzwzzz.com)</title>
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
代码如下:

  1. $thePath="E:\news"  #获取目录路径
  2. Get-ChildItem -Path $thePath -Filter "*.html"|ForEach-Object{
  3. $extension=$_.Extension #取扩展名
  4. $fileName=((get-content $_.FullName)|Select-String -Pattern "<title>" -Encoding default).Line -Replace([Regex]::Escape("<title>")),"" -Replace([Regex]::Escape(" - 读者文摘杂志(dzwzzz.com)</title>")),"" #取文件名-过滤
  5. $newName='{0}{1}' -f $fileName,$extension #过滤后的文件名+扩展名-格式化
  6. Rename-Item -Path $_.FullName -NewName $newName} #重命名文件名
复制代码
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名                  重命名后的html文件名:
----------------------------------------------------------
573.html                 两幅油画的故事.html
688.html                 马克·扎克伯格的“脸谱”.html
741.html                 戏比天大情比海深.html
 楼主| 发表于 2021-4-26 16:04:33 | 显示全部楼层
bat批量重命名html文件名的代码:
http://www.bathome.net/thread-54266-1-1.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 05:13 , Processed in 0.017416 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表