Board logo

标题: [文本处理] [已解决]批处理如何将批量文本中n个指定字符串之间行数调整为n行 [打印本页]

作者: a000000_82    时间: 2012-9-1 13:33     标题: [已解决]批处理如何将批量文本中n个指定字符串之间行数调整为n行

批处理如何将批量文本中n个指定字符串之间行数调整为n行

例如:处理前的*.txt内容如下:
+++第01组+++
aaaaaa
aaaaaa
aaaaaa

+++第02组+++
bbbbbb
bbbbbb

+++第03组+++
cccccc
cccccc
cccccc
cccccc

注:每组行数不定....
例如:判断*.txt两个(+++第)之间行数是否够十行,如果不够,则在下面用空行补足十行.....
处理后的*.txt内容如下:
+++第01组+++
aaaaaa
aaaaaa
aaaaaa







+++第02组+++
bbbbbb
bbbbbb








+++第03组+++
cccccc
cccccc
cccccc
cccccc






初来乍到希望各位大大帮帮忙!!在此先谢谢各位达人~~~
作者: QIAOXINGXING    时间: 2012-9-1 14:30

好吧,我就这水平:
  1. @echo off&SetLocal EnableDelayEdexpansion&cd /d "%~dp0"
  2. set "n=12"
  3. for /f "delims=" %%a in ('type 11.txt^&echo +++第') do (
  4.   set /a "n-=1"
  5.   set "str=%%a"
  6.   if defined flag if "!str:~0,4!" == "+++第" (
  7.     for /l %%b in (1 1 !n!) do echo;
  8.     set "n=11"
  9.   )
  10.   if not "!str!" == "+++第" echo %%a
  11.   if "!str:~0,4!" == "+++第" set "flag=1"
  12. )
  13. pause
复制代码

作者: canyuexiaolang    时间: 2012-9-1 16:46

本帖最后由 canyuexiaolang 于 2012-9-1 17:04 编辑
  1. @echo off & setlocal enabledelayedexpansion & set /a reline=-1
  2. :-----------------------------------------------------------------------
  3. set "filename=test.txt"
  4. rem 设置文件名
  5. :-----------------------------------------------------------------------
  6. (for /f "tokens=1* delims=:" %%i in ('findstr /n .* "!filename!"') do (
  7.       echo %%j | find "+" >nul && (set /a _linenum+=1,reline+=1
  8.           set /a neline=!reline!!_linenum!,line=%%i,_temp=neline-line,_temp-=__temp,__temp=_temp
  9.           for /l %%i in (1 1 !_temp!) do echo= & set /a endline+=1)
  10.       echo=%%j & set /a endline+=1)
  11.   set /a end=neline+9-endline
  12.   if !end! lss 0 set /a end=~end
  13.   for /l %%i in (1 1 !end!) do echo=
  14. )>_!filename!
  15. echo 完成^^!
  16. pause>nul
复制代码

最后测试通过
作者: apang    时间: 2012-9-1 18:40

  1. @echo off&setlocal enabledelayedexpansion
  2. for /f "delims=" %%a in (a.txt) do (
  3.   set "str=%%a"
  4.   if "!str:~,4!"=="+++第" set/a m+=1,n=0
  5.   set/a n+=1&set ".!m!_!n!=!str!"
  6. )
  7. for /l %%a in (1 1 !m!) do (
  8.   for /l %%b in (1 1 11) do echo,!.%%a_%%b!
  9. )
  10. pause
复制代码

作者: canyuexiaolang    时间: 2012-9-1 18:59

回复 4# apang

话说怎么不行...
作者: apang    时间: 2012-9-1 19:22

回复 5# canyuexiaolang

奇怪了,我在Win7下测试可以呀
作者: canyuexiaolang    时间: 2012-9-1 20:10

回复 6# apang
我也是win7...
作者: a000000_82    时间: 2012-9-2 00:39

三个都能用,衷心感谢三位大大的帮忙!

另:可能文本过大,共76500组,现在二个多小时还没有运行完,请问能否将速度调整快些吗?
作者: FOR    时间: 2012-9-7 01:29

  1. @echo off&setlocal enabledelayedexpansion
  2. (for /f "delims=" %%i in (a.txt) do (
  3. set "str=%%i"
  4. set /a h+=1
  5. if "!str:~0,4!"=="+++第" (
  6. set m=1
  7. if !m! equ 1 set /a n=11-h
  8. set h=0
  9. if !n! gtr 0 (
  10. if defined i for /l %%a in (1 1 !n!) do echo;
  11. set /a m=0,i=0
  12. )
  13. )
  14. echo %%i
  15. ))>b.txt
  16. set /a n=10-h
  17. (for /l %%a in (1 1 !n!) do echo;)>>b.txt
  18. echo ok
  19. pause
复制代码

作者: FOR    时间: 2012-9-7 01:50

谈谈看法
2楼兄弟的代码应该是效率最高的设计,但为了能正确处理最后一个 +++第 的组,用了type 导致速度被拉下不知多少倍,估计他事先不知道是海量数据,否则把最后一个组放到for外面来处理就ok了。

3楼代码,用到了findstr 不用说和type一样,效率低下,更甚者还用到了管道、及find 速度应该慢的无法忍受。

4楼代码,虽说没用外部命令也没用管道,可不是在一次for循环中完成的,效率应该也是大打折扣。
光是最后一组for运行的次数就是 76500*11 够受的。估计也是事先不知道要处理的数据量如此巨大。

总的来说,用bat来处理这样的大数据效率都不可能理想,建议用第三方工具,如 gawk 等。。




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2