找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
楼主: 娜美

[文本处理] gawk 支持哪些编码?

[复制链接]
 楼主| 发表于 2023-8-15 17:07:36 | 显示全部楼层
回复  娜美


试试这样:建议把文件链接更新到顶楼方便大家查看
Batcher 发表于 2023-8-15 16:49


顶楼已添加测验文件链接

我想弄明白gawk是否支持UTF16编码文本

   因为gawk5.1版本有一个区域编码提示



  1. gawk --h
  2. GNU Awk 5.1.0, API: 4.1 (GNU MPFR 4.1.0, GNU MP 6.2.0) (mingw-w64)Copyright (C) 1989, 1991-2020 Free Software Foundation.
  3. -Z locale-name          --locale=locale-name
复制代码
 楼主| 发表于 2023-8-15 17:12:47 | 显示全部楼层
本帖最后由 娜美 于 2023-8-15 17:18 编辑

回复 13# Five66

试了不行, 但没任何错误提示,   但输出为空

这个是gawk5.1 版本, 你试试看
   https://wwkt.lanzoul.com/iOZVa15gopbi
 楼主| 发表于 2023-8-16 13:51:24 | 显示全部楼层
gawk是支持utf16的吧,也许是你文件路径问题
Five66 发表于 2023-8-15 16:35



gawk不支持utf16编码文件 !
发表于 2023-8-16 14:55:39 | 显示全部楼层
回复 18# 娜美

也不能说不支持,总之看下面的图

发表于 2023-8-16 15:13:46 | 显示全部楼层
回复 19# Five66

还是说一下吧,图里用的就是1楼的gawk和txt
第一个命令,能读取并输出,只不过连utf16的bom也一起输出了
第二个命令,用了--locale选项,也能读取并输出,跟第一个命令相比,输出时连utf16的bom也没了
至于那些空格,就是utf16那些00字节,大概是gawk输出也是utf16,由于cmd编码默认ansi,输出时的utf16被cmd当成ansi了,然后00字节显示成空了
 楼主| 发表于 2023-8-16 15:30:28 | 显示全部楼层
回复 20# Five66


  那怎么解嘛  中文是占了2个字节,   ,要等gawk升级, 还是只能只样了
发表于 2023-8-16 15:47:30 | 显示全部楼层
回复 21# 娜美

只是看起来那样,实际又没变,不使用cmd的输出重定向应该就行了吧
实在不行或者就是想用gawk,那就用cygwin或者mingw的gawk
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 15:37 , Processed in 0.017043 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表