找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
楼主: winbat

[文本处理] [已解决]批处理如何根据指定文本列出的数字号码段提取其他多个文本内容数字号码

[复制链接]
发表于 2016-9-30 16:19:53 | 显示全部楼层
回复 15# winbat

核对下代码,不改5楼的代码直接运行只显示“请按任意键继续. . . ”么?
 楼主| 发表于 2016-9-30 17:59:46 | 显示全部楼层
本帖最后由 pcl_test 于 2016-9-30 18:18 编辑

回复 16# pcl_test


// 5 楼的代码运行只 cmd 回显,“ 请按任意键继续. . .  ”
// 号码段文本\批处理等全放在一个文件夹,添加 8 楼 输出代码 运行,没输出
发表于 2016-9-30 18:33:14 | 显示全部楼层
本帖最后由 pcl_test 于 2016-12-1 19:34 编辑

回复 17# winbat
  1. //&cls&cd /d "%~dp0"&cscript -nologo -e:jscript "%~f0"&pause&exit

  2. var fso = new ActiveXObject('Scripting.FileSystemObject');
  3. var file = '截取号码段.txt';
  4. var s = '', files={}, list={};
  5. if(!fso.FileExists(file))WSH.Echo(file+'不存在');
  6. var text = fso.OpenTextFile(file, 1).ReadAll().split(/[\r\n]/);
  7. for(var i=0; i<text.length; i++){
  8.     var name = text[i].slice(0,4);
  9.     if(!files[name])files[name]=1;
  10.     text[i].replace(/\d{4}(\d{7})\d{2}-\d{4}(\d{7})\d{2}/, function(a,b,c){
  11.         for(var j=Number(1+''+b);j<=Number(1+''+c);j++){
  12.             list[name+(''+j).slice(1)]=j
  13.         }
  14.     })
  15. }
  16. for(var f in files){
  17.     if(!fso.FileExists(f+'.txt')){
  18.         WSH.Echo(f+'.txt不存在')
  19.     }else{
  20.         try{
  21.             var ftext = fso.OpenTextFile(f+'.txt', 1).ReadAll().split(/[\r\n]/);
  22.             for(var i=0; i<ftext.length; i++){
  23.                 var str = ftext[i].replace(/^\s*|\s*$/g,'');
  24.                 if(!/^\d{13}$/.test(str))WSH.Echo(f+'.txt:第'+(i+1)+'行['+str+']含有非数字字符或长度不为13位');
  25.                 if(list[str.slice(0,11)])s+=str+'\r\n';
  26.             }
  27.         }catch(e){WSH.Echo(f+'.txt为空文件')}
  28.     }
  29. }
  30. fso.CreateTextFile('结果.txt', 2).Write(s);
复制代码
这样呢,显示什么
发表于 2016-9-30 21:46:03 | 显示全部楼层
回复 1# winbat

测试于 win7 64位
  1. @echo off & setlocal enabledelayedexpansion

  2. >result.txt cd.

  3. for /f "tokens=1,2 delims=-" %%a in (截取号码段.txt) do (

  4.     set "a=%%a" & set "b=%%b" & set "name=!a:~0,4!"

  5.     for /f tokens^=2delims^=: %%i in ('find /c /v "" "!name!.txt"') do set /a "lb=0, ub=%%i, sk=ub/2"
  6.     call :PAfterLines "!name!.txt" "!a:~0,13!" 0

  7.     call :writeTemp "!name!.txt" tmpfile new
  8.     sort /r tmpfile /o tmpfile

  9.     for /f tokens^=2delims^=: %%i in ('find /c /v "" tmpfile') do set /a "lb=0, ub=%%i, sk=ub/2"
  10.     call :PAfterLines tmpfile "!b:~0,13!" -1
  11.     call :writeTemp tmpfile result.txt
  12. )
  13. sort result.txt /o result.txt
  14. del tmpfile
  15. pause
  16. exit


  17. :writeTemp infile outfile new
  18. if "%3" neq "" >"%~2" cd.
  19. if !sk! equ 0 (copy "%~2" + "%~1" "%~2" & exit /b)
  20. >>"%~2"  (for /f skip^=%sk% %%a in (%~s1) do echo;%%a)
  21. exit /b


  22. REM order = 0 升序 order = -1 反序
  23. :PAfterLines file str order
  24. if !sk! equ 0 exit /b
  25. for /f skip^=%sk% %%a in (%~1) do (
  26.     if !lb! geq !ub! exit /b
  27.     if "%%a" gtr "%~2" (
  28.         set /a "ub=(~%3 & sk)|(%3 & ub), lb=(~%3 & lb)| (%3 & (sk+^!(lb-sk))), sk=(lb+ub)>>1"
  29.         call :PAfterLines %~1 %~2 %3 &  exit /b
  30.     ) else if "%%a" equ "%~2" (         exit /b
  31.     ) else (
  32.         set /a "lb=(~%3 & (sk+^!(lb-sk)))|(%3 & lb), ub=(~%3 & ub)|(%3 & sk), sk=(lb+ub)>>1"
  33.         call :PAfterLines %~1 %~2 %3 &  exit /b
  34.     )
  35. )
  36. exit /b


复制代码

评分

参与人数 1技术 +1 收起 理由
winbat + 1 测试代码能过

查看全部评分

发表于 2016-10-1 01:50:25 | 显示全部楼层
本帖最后由 codegay 于 2016-10-1 01:52 编辑

python3
楼主这个数据源太不多科学了。应该切分成列合并,统一存到一个数据库或者表格中。需要的时候再查询出来。
尼马地这样各种分片拼接字符串,又搞各种类型转换,麻烦累,效率还低。
  1. #2016年10月1日 00:25:33 codegay

  2. with open("截取号码段.txt") as f:
  3.         号码段 =  [r.strip().split("-") for r in f.readlines()]
  4. result = []
  5. for s,e in 号码段:
  6.         fn = s[:4] #filename
  7.         start = s[4:11]
  8.         end = e[4:11]
  9.         numlist = [fn+str(r).rjust(7,'0') for r in range(int(start),int(end)+1)]
  10.         with open(fn+".txt") as f:
  11.                 txt = f.readlines()
  12.         for n in numlist:
  13.                 result += [l for l in txt if l.startswith(n)]

  14. print(result)

  15. with open("newresult.txt","w+") as f:
  16.         f.writelines(result)
复制代码
 楼主| 发表于 2016-10-1 12:37:03 | 显示全部楼层
回复 18# pcl_test


   生成 结果.txt 文本但没内容
 楼主| 发表于 2016-10-1 12:38:54 | 显示全部楼层
回复 19# aa77dd@163.com


    生成 result.txt ,内容是合并号码段文本,没截取

cmd 回显:

tmpfile
0000.txt
已复制         1 个文件。
tmpfile
1250.txt
已复制         1 个文件。
请按任意键继续. . .
发表于 2016-10-1 12:40:39 | 显示全部楼层
本帖最后由 pcl_test 于 2016-10-1 12:41 编辑

回复 21# winbat

嗯,我以你顶楼给出的样本测试没有问题,自行找原因或者把QQ私密我吧
 楼主| 发表于 2016-10-1 12:45:57 | 显示全部楼层
回复 20# codegay


    国庆节快乐!不懂 py3 机子到装了 py2.7 , 数据处理并不需要分割,不好意思你理解错了这是我的错,图片只为了更直观的了解。截取结果是例如上传的 result.txt 输出结果。
 楼主| 发表于 2016-10-1 12:47:01 | 显示全部楼层
回复 23# pcl_test


    好的,谢谢 @pcl_test 老大 国庆节快乐!
发表于 2016-10-1 13:28:32 | 显示全部楼层
本帖最后由 aa77dd@163.com 于 2016-10-1 14:04 编辑

回复 22# winbat

我测试是所有文件都在同一目录

好吧   我知道楼主是一点批处理也不会了   只用在 截取号码段.txt 前加上目录 tmp\ 就行了

仍有疑问, 下载完整测试包
http://pan.baidu.com/s/1gfr1Kyv
  1. @echo off & setlocal enabledelayedexpansion

  2. >result.txt cd.

  3. for /f "tokens=1,2 delims=-" %%a in (tmp\截取号码段.txt) do (

  4.     set "a=%%a" & set "b=%%b" & set "name=!a:~0,4!"

  5.     for /f tokens^=2delims^=: %%i in ('find /c /v "" "!name!.txt"') do set /a "lb=0, ub=%%i, sk=ub/2"
  6.     call :PAfterLines "!name!.txt" "!a:~0,13!" 0

  7.     call :writeTemp "!name!.txt" tmpfile new
  8.     sort /r tmpfile /o tmpfile

  9.     for /f tokens^=2delims^=: %%i in ('find /c /v "" tmpfile') do set /a "lb=0, ub=%%i, sk=ub/2"
  10.     call :PAfterLines tmpfile "!b:~0,13!" -1
  11.     call :writeTemp tmpfile result.txt
  12. )
  13. sort result.txt /o result.txt
  14. del tmpfile
  15. fc result.txt 期待结果.txt
  16. pause
  17. exit


  18. :writeTemp infile outfile new
  19. if "%3" neq "" >"%~2" cd.
  20. if !sk! equ 0 (copy "%~2" + "%~1" "%~2" & exit /b)
  21. >>"%~2"  (for /f skip^=%sk% %%a in (%~s1) do echo;%%a)
  22. exit /b


  23. REM order = 0 升序 order = -1 反序
  24. :PAfterLines file str order
  25. if !sk! equ 0 exit /b
  26. for /f skip^=%sk% %%a in (%~1) do (
  27.     if !lb! geq !ub! exit /b
  28.     if "%%a" gtr "%~2" (
  29.         set /a "ub=(~%3 & sk)|(%3 & ub), lb=(~%3 & lb)| (%3 & (sk+^!(lb-sk))), sk=(lb+ub)>>1"
  30.         call :PAfterLines %~1 %~2 %3 &  exit /b
  31.     ) else if "%%a" equ "%~2" (         exit /b
  32.     ) else (
  33.         set /a "lb=(~%3 & (sk+^!(lb-sk)))|(%3 & lb), ub=(~%3 & ub)|(%3 & sk), sk=(lb+ub)>>1"
  34.         call :PAfterLines %~1 %~2 %3 &  exit /b
  35.     )
  36. )
  37. exit /b


复制代码

评分

参与人数 1技术 +1 收起 理由
winbat + 1 测试代码结果正解

查看全部评分

发表于 2016-10-1 21:09:36 | 显示全部楼层
这些是号码是条形码?
还是门店之类编码?
 楼主| 发表于 2016-10-4 16:01:16 | 显示全部楼层
回复 27# codegay


    嗯,是条形码
 楼主| 发表于 2016-10-4 16:08:14 | 显示全部楼层
回复 26# aa77dd@163.com


    谢谢,@aa77dd@163.com 代码测试通过,手工试了另一批产品结果 号码段及数量 都对,非常感谢 @aa77dd@163.com @pcl_test  @codegay 及热帮助的坛友们。
这里是个很能让人学习到东西的地方,期望坛子越来越好!最后祝大家国庆快乐!
发表于 2016-10-6 19:26:42 | 显示全部楼层
回复 29# winbat


    楼主你当真在这个论坛学东西了吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 16:03 , Processed in 0.015531 second(s), 6 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表