找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 29571|回复: 6

[文本处理] 关于 文本编码的识别与输出(2016/2/3)

[复制链接]
发表于 2016-1-25 22:31:03 | 显示全部楼层 |阅读模式
本帖最后由 wskwfkbdn 于 2016-2-3 16:23 编辑

Windows自带的记事本中常见的Utf-8 / Unicode / Ansi 几种编码,cmd控制台本身是可以显示 Unicode和Ansi/Gbk字符集,而Utf-8编码的文本就不支持了,type出来都是乱码,如果必要的话去处理文本内容,需要去Utf-8 -> Ansi才能够正常处理文本,于是乎,我就去研究了一阵编码与字符集的一些特征,终于实现了几种编码的识别,先来看看效果图吧!


原理:命令行自动识别出文本文件的编码,并转换ANSI字符输出,目前我暂时就实现这一功能,以后如果支持的人多了,也会考虑在这个一功能上面继续开发出  文本替换、编码转换、字符匹配 等基本功能。



点此下载 该文件

评分

参与人数 1技术 +1 收起 理由
whiter + 1 so good

查看全部评分

发表于 2016-1-26 09:18:10 | 显示全部楼层
回复 1# wskwfkbdn
粉你,,请继续。
发表于 2016-1-26 09:27:57 | 显示全部楼层
非常好请继续
发表于 2016-1-26 19:54:30 | 显示全部楼层
下载链接呢?
 楼主| 发表于 2016-1-26 21:22:23 | 显示全部楼层

标题

回复 4# pcl_test
自用电脑维修中,图中的脚本是之前的,之后我再补上地址。
发表于 2022-12-31 13:19:19 | 显示全部楼层
很好用。
某些情况下这种工具是必要的,例如另一个第三方html2txt虽然将html转换为txt时支持中文,但是输出的文件是utf8编码。想要批处理自动处理文本,必须有办法实现命令行编码转换。
发表于 2023-1-24 19:14:07 | 显示全部楼层
回复 1# wskwfkbdn

执行如下指令做测试:

  1. "D:\test\EnTextChange_Beta>@for /f %a in ('dir /b "文本编码查看*.txt"') do @echo;&@echo;"%~fa"&@EnTextChange -Text:"%~fa"
复制代码
结果如下:

  1. "D:\test\EnTextChange_Beta\文本编码查看ANSI.txt"
  2. 使用方法:拖放任意文件到程序图标处即可。

  3. "D:\test\EnTextChange_Beta\文本编码查看UTF-16_BE.txt"
  4. ?使用方法:拖放任意文件到程序图标处即可。

  5. "D:\test\EnTextChange_Beta\文本编码查看UTF-16_LE.txt"
  6. ?使用方法:拖放任意文件到程序图标处即可。

  7. "D:\test\EnTextChange_Beta\文本编码查看UTF-8.txt"
  8. 使用方法:拖放任意文件到程序图标处即可。

  9. "D:\test\EnTextChange_Beta\文本编码查看UTF-8_BOM.txt"
  10. ?使用方法:拖放任意文件到程序图标处即可。

  11. D:\test\EnTextChange_Beta>
复制代码
用记事本查看的结果全部为:

  1. 使用方法:拖放任意文件到程序图标处即可。
复制代码
但实际在上述输出结果中(5行)UTF-16 BE、(8行)UTF-16_LE、(14行)UTF-8_BOM会出现前导(?)问号
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-16 23:47 , Processed in 0.020344 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表