|
|
本帖最后由 w1983912 于 2017-11-16 01:01 编辑
BAT 或者vbs
入txt
若干txt 1-1000多个 每个txt 约有5万行左右数据,淡然也可以分割后处理
每行数据组成:###后为数字 前为 符号 字母 数字 中文 其他文都有可能
以1.txt开始
游戏###450
高 1aaa###9910
游戏###150
123可以 哈么###1
kdkekke###70001
游戏game###450
先把 ###号前的字符串 绝对匹配 删除重复的 除第一条外 (保留行号最小的那条)
输出格式为: @@@游戏###450!!! @@@ ### !!! 这3个也可以换成别的 最好赋值吧 方便我换成别的字符
@@@游戏###450!!!
@@@高 1aaa###9910!!!
@@@123可以 哈么###1!!!
@@@kdkekke###70001!!!
@@@游戏game###450!!!
保存为all.txt文件
然后进入处理2.txt 删除掉 前部分重复的数据 再和all.txt 比较是否有重复的 不重复的都加进all.txt 按顺序 如1.txt 然后是2.txt写入all.txt .......
最好先处理 单个txt 因为单个小的txt重复可以处理的快吧
具体方式 按你的来 高效处理为好
有劳各位朋友帮忙一下 先谢谢了 |
|