Board logo

标题: [其他] 【已解决】gawk:提取出现最多次数的字符 [打印本页]

作者: 思想之翼    时间: 2023-5-22 17:17     标题: 【已解决】gawk:提取出现最多次数的字符

本帖最后由 思想之翼 于 2023-5-25 02:51 编辑

D:\JZ\A.txt  如果每行只有1个字母
G
B
J
J
E
E
结果 J E 竖排写入D:\JZ\B.txt
  1. gawk "{++a[$0];a[$0]>n+0?n=a[$0]:n=n+0}END{for(i in a)if(a[i]==n)print i}" "D:\JZ\A.txt">"D:\JZ\B.txt"
复制代码
  1. gawk "{n=n<++a[$0]?a[$0]:n}END{for(k in a)if(n==a[k])print k}"<"D:\JZ\A.txt">"D:\JZ\B.txt"
复制代码
  1. gawk "{if(max<=++a[$0]){max=a[$0];b[max]=b[max]$0\"\n\"}}END{printf b[max]}" D:\JZ\A.txt > D:\JZ\B.txt
复制代码
D:\JZ\A.txt  如果每行有若干字母
G B B
B C C C A
J
J
E
E
结果 B C
上述代码如何修改?
作者: terse    时间: 2023-5-22 19:57

加个FOR 利用NF应该行
作者: terse    时间: 2023-5-22 20:49

这样符合不
路径自己加一下
  1. gawk "{for(i=1;i<=NF;i++) a[$i]++} END {for(k in a) if(a[k]>max){max=a[k];s=k}else if(a[k]==max)s=s\" \"k; print s}" a.txt
复制代码

作者: hfxiang    时间: 2023-5-23 12:12

回复 1# 思想之翼
  1. gawk "{for(i=1;i<=NF;i++)n=n<++a[$i]?a[$i]:n}END{for(k in a)if(n==a[k])print k}" "D:\JZ\A.txt">"D:\JZ\B.txt"
复制代码





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2