[已解决]批处理如何判断文件编码类型并分类？ - BAT求助&讨论 - 批处理之家 BAT,CMD,批处理,PowerShell,VBS,DOS - Powered by Discuz!

批处理之家 » BAT求助&讨论 » [已解决]批处理如何判断文件编码类型并分类？

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

返回列表发帖

Rank: 8 Rank: 8

帖子: 6388
积分: 18831
技术: 978
捐助: 100
注册时间: 2010-10-9

1楼 跳转到 »

发表于 2016-3-27 08:42 | 显示全部帖子

回复 1# xp3000

http://www.bathome.net/s/tool/index.html?key=编码
enca 也许就是你想要的

1 评分人数

xp3000: 乐于助人技术 + 1

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编

Rank: 8 Rank: 8

帖子: 6388
积分: 18831
技术: 978
捐助: 100
注册时间: 2010-10-9

2楼

发表于 2016-3-27 17:11 | 显示全部帖子

或者暴力一点，find /i "charset=utf-8"，只要不是心理变态的网页应该都 ok

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编

Rank: 8 Rank: 8

帖子: 6388
积分: 18831
技术: 978
捐助: 100
注册时间: 2010-10-9

3楼

发表于 2016-3-29 01:28 | 显示全部帖子

检查 a.html 的 BOM，如果无 BOM，则试试能不能转为 gb2312，不能转就当成是 utf-8：

mshta http://bathome.net/s/hta/ t=iconv.load('a.html');b=iconv.checkBom(t);if(b=='undefined')b=iconv.toStr(t,'gb2312')?'gb2312':'utf-8';b | more
复制代码

这个是先试着转为 utf-8，如果不能转就视为 gb2312：

mshta http://bathome.net/s/hta/ t=iconv.load('a.html');b=iconv.checkBom(t);if(b=='undefined')b=iconv.toStr(t,'utf-8')?'utf-8':'gb2312';b | more
复制代码

1 评分人数

xp3000: 乐于助人技术 + 1

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编

Rank: 8 Rank: 8

帖子: 6388
积分: 18831
技术: 978
捐助: 100
注册时间: 2010-10-9

4楼

发表于 2016-3-29 01:39 | 显示全部帖子

百分百准确检测无 BOM 头的文本编码是不可能哒，因为各种无 BOM 头的编码之间常有重叠
运行以下代码返回的都是 a.html 可能的文件编码：

mshta http://bathome.net/s/hta/?string "t=iconv.load('a.html');list.charset().where(function(c){return iconv.toStr(t,c)})"|more
复制代码

不过你的 html 一般可以检测头部的 META CharSet 来获得实际的编码名

1 评分人数

xp3000: 乐于助人技术 + 1

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编