找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 9291|回复: 2

[文本处理] 【已解决】gawk:如何实现按出现次数排序

[复制链接]
发表于 2025-1-15 01:25:26 | 显示全部楼层 |阅读模式
本帖最后由 思想之翼 于 2025-1-15 10:05 编辑

1.txt 格式如下:
331 445 550 567 0000
008 023 327 550 689
142 350 331 449 550 653
0 0 0 0 0 0 0 0 0 0 0 0
X Y Z
A A A A A A A A A A A A A

下述代码将 1.txt 数值按出现次数排序:
  1. gawk "{for(i=1;i<=NF;i++){if(!a[$i]++)b[++j]=$i;if(0+N<a[$i])N=a[$i]}}END{for(k=1;k<=j;k++)c[a[b[k]]]=c[a[b[k]]]b[k]" ";s=asorti(c,tA);for(i=s;i>0;i--)print c[tA[i]]}" 1.txt > 2.txt
复制代码
2.txt 排序结果错误
550
331
A
0
445 567 0000 008 023 327 689 142 350 449 653 X Y Z

【问题】如何实现正确的排序结果:
A     (出现13次)
0     (出现12次)
550 (出现3次)
331 (出现2次)
445 567 0000 008 023 327 689 142 350 449 653 X Y Z (出现1次)

评分

参与人数 1PB +2 收起 理由
Batcher + 2 感谢给帖子标题标注[已解决]字样

查看全部评分

发表于 2025-1-15 07:38:44 | 显示全部楼层
不稳定, 相同次数的顺序不确定

  1. gawk "{for(i=NF;i;i--)A[$i]++}END{for(i in A)B[A[i]]=B[A[i]]""i" ";PROCINFO["sorted_in"]="@ind_num_desc";for(i in B)print B[i]}" 1.txt > 2.txt
复制代码

评分

参与人数 1技术 +1 收起 理由
思想之翼 + 1 感谢,正确

查看全部评分

发表于 2025-1-15 12:48:54 | 显示全部楼层
回复 1# 思想之翼

给一个 bat+sed.exe+sort76.exe 版本,其中 sort76.exe 从本坛第三方下载 sort v76版...

  1. @echo off &setlocal &for /f "delims=" %%a in (1.txt) do for %%v in (%%a) do set/a "_#%%v+=1"
  2. (set _#)|sort76 -t "=" -r -n -k2|sed "s/^..//gi">2.txt
  3. type "2.txt"&pause&exit/b
复制代码

评分

参与人数 1技术 +1 收起 理由
思想之翼 + 1 学习了

查看全部评分

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 10:22 , Processed in 0.019603 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表