找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 22577|回复: 3

[文本处理] 大数据文本替换哪个工具的效率高?

[复制链接]
发表于 2014-3-15 23:54:26 | 显示全部楼层 |阅读模式
本帖最后由 wjx515 于 2014-3-17 15:03 编辑

求问,大数据文本替换哪个工具的效率高? 文本数据有10g左右,想把其中的aaaa替换成bbbb,sed和awk哪个命令的效率比较高?还有效率更高的命令吗?
文本缩了还有将近1G大小,就不上传了,可以生成个大文本测试下
  1. @echo off
  2. echo,TEST TEST  TEST  TEST  TEST  TEST  REPLACE>test.txt
  3. for /l %%a in (1 1 40)do type test.txt >>test.txt&for %%z in (test.txt)do title %%a:  %%~zz byte
  4. pause
复制代码
试了下sed和awk,都不太快,看来还是文件太大了。
发表于 2014-3-16 22:13:33 | 显示全部楼层
  1. sed "s/aaaa/bbbb/g" a.txt > b.txt
复制代码
发表于 2014-3-16 22:14:06 | 显示全部楼层
  1. gawk "gsub(/aaaa/,"bbbb")" a.txt > b.txt
复制代码
发表于 2014-3-17 00:54:19 | 显示全部楼层
这实际上是个,软件pk的问题,我最喜欢这个了。
请把你的文本,用7-zip +lama2 压缩了,传上网盘。
搜索和替换的内容也请贴出来,我们好找软件pk呀。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-21 06:35 , Processed in 0.029530 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表