[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖
本帖最后由 yakeyun 于 2022-5-20 14:07 编辑

回复 1# 13545876873

贴主要表达的意思:
D盘存在如下两个目录:
D:\基因合成\2022.5
                              \5001\
                              \5002\
                              \5003\
D:\测序结果
                  \[K3746-5001-1-26-PUC57]M13-48_B03.ab1
                  \[K3746-5001-25-48-PUC57]M13-48_B03.ab1
                  \[T4567-5003-25-48-PUC57]M13-47_C03.ab1
                  \[V2001-5002-25-48-PUC57]M13-47_C03.ab1

需求读取D:\测序结果目录中的文件,根据5001、5002、5003字段分类文件,然后移动到D:\基因合成\2022.5\目录下对应字段文件夹中。

另存为ANSI格式,不然中文目录不会被识别。
  1. @echo off&setlocal enabledelayedexpansion
  2. for /f %%a in ('dir /a /s /b "D:\测序结果\*.ab1"') do (
  3. set dvn=%%a
  4. for /f "tokens=2 delims=[]" %%b in ("!dvn!") do (
  5. for /f "tokens=2 delims=-" %%c in ("%%b") do (
  6. set mls=%%c
  7. set Ns=%date:~0,4%
  8. set Ys=%date:~5,2%
  9. if !Ys!==01 (set "Ys=!Ys:01=1!")
  10. if !Ys!==02 (set "Ys=!Ys:02=2!")
  11. if !Ys!==03 (set "Ys=!Ys:03=3!")
  12. if !Ys!==04 (set "Ys=!Ys:04=4!")
  13. if !Ys!==05 (set "Ys=!Ys:05=5!")
  14. if !Ys!==06 (set "Ys=!Ys:06=6!")
  15. if !Ys!==07 (set "Ys=!Ys:07=7!")
  16. if !Ys!==08 (set "Ys=!Ys:08=8!")
  17. if !Ys!==09 (set "Ys=!Ys:09=9!")
  18. set "today=!Ns!.!Ys!"
  19. if exist D:\基因合成\!today!\!mls! (move /y "!dvn!" "D:\基因合成\!today!\!mls!" >nul) else (
  20. md "D:\基因合成\!today!"
  21. md "D:\基因合成\!today!\!mls!"
  22. move /y "!dvn!" "D:\基因合成\!today!\!mls!" >nul
  23. )
  24. )
  25. )
  26. )
  27. exit
复制代码
1

评分人数

TOP

回复 15# 13545876873


条件本身就冲突,没办法操作。5001存在2个文档,取值会出错。

TOP

回复 22# 13545876873

代码备份留存,如果单纯的只需要提取11~24行信息,可以用下面的代码,但是你的文件没有规律,且文件用记事本打开一行的内容太长了,最主要的是要你自己明白这个文件和其它文件是否有规律,比如字符位置是否固定等等。
  1. @echo off&setlocal enabledelayedexpansion
  2. set today=2022.5
  3. set mls=5001
  4. set txts=5001-11-24
  5. for /f %%d in ('dir /a /s /b "D:\基因合成\!today!\!mls!\*.htm"') do (
  6. for /f "skip=10 tokens=*" %%e in (%%d) do (
  7. set op=%%e
  8. set /a m+=1
  9. if !m! LEQ 14 (
  10. echo !op!
  11. )
  12. )
  13. ) >D:\基因合成\!today!\!mls!\!txts!.txt
  14. (
  15. for /f %%i in ('type D:\基因合成\!today!\!mls!\!txts!.txt') do (
  16. echo %%i
  17. )
  18. )>D:\基因合成\!today!\!mls!\!mls!.txt
  19. exit
复制代码
1

评分人数

TOP

本帖最后由 yakeyun 于 2022-5-22 23:26 编辑

回复 24# 13545876873
你这个获取的结果已经很明显了,说明html文件并不是TXT文件里面的行内容,需要你自己找一下规律,然后根据规律来截取。
比如第十行有数据,那么第十行的第几个到第几个是固定字符,或者字符被特殊字符夹在中间等。只有有规律的文本才能被批处理。

比如我帮你找出来的规律,你的5001.txt序列文件,可以用我上面发的代码获取到,不过代码要改成下面这个。
从取值可以看到,所有类容都是一行显示,为了发现规律,我故意将前面“><span”后面的字符分行。那么剩下的规律就是将取值进行赋值,
比如获取到的“5001-11-24.txt”文本,除了文件头和文件尾没有规律,中间部分全部都是规律字符,只需要将结果做4次替换,就可以取到正确结果。
  1. @echo off&setlocal enabledelayedexpansion
  2. set txts=5001-11-24
  3. for /f %%d in ('dir /a /s /b ".\*.htm"') do (
  4. for /f "skip=9 tokens=*" %%e in (%%d) do (
  5. set op=%%e
  6. set /a m+=1
  7. if !m! LEQ 1 (
  8. echo !op!
  9. )
  10. )
  11. ) >.\!txts!.txt
复制代码



通过替换法测试发现,提取后的文本,只需要再次替换下面4处文本即可:

<tr><td>5'--&gt;3'</td><td style="color:silver">
<span style="color:red;">
</span>
</td></tr>
1

评分人数

TOP

本帖最后由 yakeyun 于 2022-5-23 21:40 编辑

回复 30# 13545876873

把27楼代码保存为MyScript.ps1:
  1. $html = gc '.\5001.htm' -Raw -Encoding UTF8;
  2. $oligos_arr=[regex]::Matches($html, '(?i)(?<=<tr><td>oligos.*?style.*?>)[^<]+').value.Foreach{
  3. ($_.Trim('|') -replace '&nbsp;|[@\(+\)]' -split '\|').Foreach{
  4. $e=$_.split(':');
  5. @{ID=$e[0].Trim('-'); begin=[int]$e[1]; end=[int]$e[2]; }
  6. }
  7. }
  8. $_5gt3=[regex]::Match($html, "(?<=5'--&gt;3'.*?style.*?>).*?(?=</td>)").value -replace '<.*?>';
  9. #$_3lt5=[regex]::Match($html, "(?<=3'&lt;--5'.*?style.*?>).*?(?=</td>)").value -replace '<.*?>';
  10. <# 5000-1-14 ... #>
  11. ('5001-1-14','5001-1-26','5001-25-38','5001-25-52').ForEach{
  12. $arr=$_.split('-');
  13. $index1=$oligos_arr.ID.IndexOf($arr[0]+'_'+$arr[1]);
  14. $index2=$oligos_arr.ID.IndexOf($arr[0]+'_'+$arr[2]);
  15. if($index1 -ne -1 -and $index2 -ne -1){
  16. [int]$t1=$oligos_arr[$index1].begin - 1;
  17. [int]$t2=$oligos_arr[$index2].end - 1;
  18. sc ".\$_.txt" -Value (-join($_5gt3[$t1..$t2])) -Force -Verbose -NoNewline;
  19. }
  20. }
  21. [Console]::Write("全部完成!");
复制代码
同目录下放一个MyScript.bat:
  1. @echo off
  2. PowerShell.exe -ExecutionPolicy Bypass -Command "& '%~dpn0.ps1'"
  3. exit
复制代码
直接执行MyScript.bat即可实现自动提取数据,虽然不懂Powershell功能,但是感觉比批处理还是要功能更强大一些。


1

评分人数

TOP

返回列表