[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖
回复 1# xp3000


    http://www.bathome.net/s/tool/index.html?key=编码
enca 也许就是你想要的
1

评分人数

TOP

或者暴力一点,find /i "charset=utf-8",只要不是心理变态的网页应该都 ok

TOP

检查 a.html 的 BOM,如果无 BOM,则试试能不能转为 gb2312,不能转就当成是 utf-8:
  1. mshta http://bathome.net/s/hta/ t=iconv.load('a.html');b=iconv.checkBom(t);if(b=='undefined')b=iconv.toStr(t,'gb2312')?'gb2312':'utf-8';b | more
复制代码
这个是先试着转为 utf-8,如果不能转就视为 gb2312:
  1. mshta http://bathome.net/s/hta/ t=iconv.load('a.html');b=iconv.checkBom(t);if(b=='undefined')b=iconv.toStr(t,'utf-8')?'utf-8':'gb2312';b | more
复制代码
1

评分人数

TOP

百分百准确检测无 BOM 头的文本编码是不可能哒,因为各种无 BOM 头的编码之间常有重叠
运行以下代码返回的都是 a.html 可能的文件编码:
  1. mshta http://bathome.net/s/hta/?string "t=iconv.load('a.html');list.charset().where(function(c){return iconv.toStr(t,c)})"|more
复制代码
不过你的 html 一般可以检测头部的 META CharSet 来获得实际的编码名
1

评分人数

TOP

返回列表