找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 15538|回复: 3

[问题求助] powershell将word另存多个文件

[复制链接]
发表于 2022-10-2 06:54:12 | 显示全部楼层 |阅读模式
本帖最后由 5i365 于 2022-10-2 07:01 编辑

有一个word文件, 一共有N章, 每章的标题样式都是 标题一

我想把每章标题及其下内容抽取出来另存为一个新的docx文件, 文件名就是标题一的文本


很有规律, 另外,每章都是从一页的最开头有的内容

有一个难点, 页眉中的页码要保留拆分前的页码

求大侠支招, 提前感谢



测试文件
https://send.cm/d/FM5T
发表于 2022-10-4 19:32:42 | 显示全部楼层
大概像这样
  1. #@&cls&powershell "type '%~0'|out-string|iex"&pause&exit
  2. $in='测试.docx'
  3. $out=$in+'.zip'
  4. copy $in ($in+'.zip')
  5. $f=gi $out
  6. $xf='document.xml'
  7. $shell=New-Object -com shell.application
  8. $shell.Namespace("$pwd").MoveHere($($shell.NameSpace($f.fullname+'\word').items()|?{ $_.name -eq $xf }))
  9. $xf=gi $xf
  10. $a=gc $xf -enc utf8
  11. $a[1] -match '(?<=\<w:body\>).*(?=\<w:sectpr)'
  12. $b=$matches[0]
  13. $c=$b -split '(?<!^)(?=<w:p\s[^>]+><w:ppr><w:pStyle w:val="1"/>.*</w:p>)'
  14. del $xf
  15. $c|%{
  16.     $d=$_ -split '(?<!^)(?=<w:p\s[^>]+>)'
  17.     $fn=$d[0] -replace '<[^>]+>'
  18.     $zip=$fn+'.zip'
  19.     copy $out $zip
  20.     $zip=gi $zip
  21.     [io.file]::WriteAllLines($xf.fullname,($a -replace '(?<=\<w:body\>).*(?=\<w:sectpr)',$_))
  22.     $shell.Namespace($zip.fullname+'\word').moveHere($xf.fullname)
  23.     while(test-path $xf){sleep -m 100}
  24.     mv $zip ($zip.basename+'.docx')
  25. }
  26. del $out
复制代码
 楼主| 发表于 2022-10-5 07:23:56 | 显示全部楼层
回复 2# idwma

多谢大侠帮忙,
试了一下, 示例的文件可以正确输出, 但是实际的文件,输出后都打不开了

显示下面的错误

发表于 2022-10-5 13:12:26 | 显示全部楼层
实际文档里document.xml文件的内容是什么样的
处理分段的地方可能要改一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 01:12 , Processed in 0.009437 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表