|
|
本帖最后由 namejm 于 2011-6-6 18:46 编辑
最近有大量的html文档想转换为txt
需要用命令行工具来进行个性化的批量操作
一直在使用htox32c.exe这款命令行工具
它具有如下功能:
/Cn 设每行列数最大值 [n:1-255](79)
/T{0|1} 转换页面标题 [0:不执行,1:(执行)]
/I{a|j|s|e|u|8|p} 转换编码:
[a:(自动),j:JIS,s:shiftJIS,e:EUC,u:Unicode,8:UTF-8,p:不转换]
/S{0|1} 是否将连续空白内容合并 [0:不执行,1:(执行)]
/L{0|1} 是否删除行首行末的空白 [0:不执行,1:(执行)]
/E{0|1} 是否清除文中的EOF编码(0x1a) [0:不执行,1:(执行)]
/F{0|1} 如果转换后文本文件末尾不是回车符则添加回车符 [0:不执行,1:(执行)]
/O{0|1} 输出覆盖已有文件时是否提示 [0:不提示,1:(提示)]
/G{0|1|2|3|4"用户自定义字符串" (%s=指定替代文本)} <IMG>转换的标签
[0:(不转换),1:"[Image]",2:"[(src=)]",3:"[(alt=)]",4:用户定义]
/D{0|1|2} 表格之间文字的间隔符 [0: (半角空格) ,1:逗号 ,2:TAB]
/Q{0|1} 以指定[每行列数最大值]强制换行 [0:(不执行),1:执行]
/A{0|1} 强制表格内文字总是左对齐 [0:(不执行),1:执行]
/U{0-7} 是否执行插入链接网址
[0:(不执行),1:执行,+2:(在前后换行),+4:(仅插入外部链接)]
需要特别注意的是:
一般情况下最好加上 /IP 参数不转换编码
否则,转出来的txt会乱码
在大多数情况下能很好地完成工作
但是这款命令行工具存在一些不足之处
想请高手把它增强一下
目前需要增强的功能有如下几个:
HtoX32c.exe:http://win32lab.com/fsw/htox.html/(官网,日文)或 http://bbs.bathome.net/thread-1974-1-1.html(带中文帮助信息)
另:batman说这些功能可以用vbs来完成
如果谁能做出vbs版本的也感激不尽 |
|