Board logo

标题: [文本处理] 还是上次帮医务工作者求的代码,遇到点问题,求助朋友们再帮帮忙 [打印本页]

作者: seekbook    时间: 2022-1-9 13:10     标题: 帮医务工作者求助合并每行文本的批处理代码,感谢(已解决感谢大家)

本帖最后由 seekbook 于 2022-1-14 13:26 编辑
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. cd /d "%~dp0"
  4. set "str="
  5. for /f "delims=" %%i in ('type "a.txt"') do (
  6.     set "line=%%i"
  7.     set str=!str!,!line!
  8. )
  9. >"a_New.txt" echo !str:~1!
复制代码
以上代码只能合并1000多条,后面就不能再合并了,这两天数据文本中的数量达到上万条时,就处理不了,麻烦大哥们帮忙改进一下,非常感谢,附件传不上来,附件a.txt的样例内容如下

链接:https://pan.baidu.com/s/1gtejPAwB02orYYo0uQRMSA?pwd=63sj
提取码:63sj
--来自百度网盘超级会员V5的分享

大概以后可能会处理有1万多行左右
作者: went    时间: 2022-1-9 13:20

空格变逗号
  1. set "p=!p!,%%i"
复制代码
生成新文件
  1. >"%fn%_NEW.tem"
复制代码
没有测试,应该正确
作者: Batcher    时间: 2022-1-9 13:24

回复 1# seekbook


test1.bat
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. cd /d "%~dp0"
  4. set "str="
  5. for /f "delims=" %%i in ('type "病例.txt"') do (
  6.     set "line=%%i"
  7.     set str=!str!,!line!
  8. )
  9. >"病例_New.txt" echo !str:~1!
复制代码

作者: Batcher    时间: 2022-1-9 13:26

回复 1# seekbook


test2.bat
  1. @echo off
  2. cd /d "%~dp0"
  3. (for /f "delims=" %%i in ('type "病例.txt"') do (
  4.     set /p =%%i,<nul
  5. ))>"病例_New.txt"
复制代码

作者: seekbook    时间: 2022-1-9 13:57

回复 2# went

谢谢,逗号可以了,生成新文件好像不行
作者: seekbook    时间: 2022-1-9 13:59

回复 3# Batcher


  谢谢管理,刚才测试了这个会乱码
作者: went    时间: 2022-1-9 14:06

回复 5# seekbook

    改成这样,还要把第10行的move语句删掉
  1. >"%fn%_NEW.txt"
复制代码

作者: seekbook    时间: 2022-1-9 14:31

回复 7# went

感谢大哥,可以了,好像还忘了一个条件,就是病例里面有重复的行,有时有多好几条是一样的,只保留一条的话,这个可以麻烦帮我再加一下吗谢谢
作者: went    时间: 2022-1-9 15:07

回复 8# seekbook


    保存为bat文件,选择ansi编码
  1. powershell "(Get-Content '病例.txt' | Select-Object -Unique) -join ','" > "病例_NEW.txt"
复制代码

作者: Batcher    时间: 2022-1-9 16:47

回复 6# seekbook


请参考Q-04和Q-05把bat文件和txt文件都保存为ANSI编码:
https://mp.weixin.qq.com/s/6lbb97qUOs1sTyKJfN0ZEQ
作者: seekbook    时间: 2022-1-11 21:52     标题: 还是上次帮医务工作者求的代码,遇到点问题,求助朋友们再帮帮忙

本帖最后由 seekbook 于 2022-1-12 09:05 编辑
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. cd /d "%~dp0"
  4. set "str="
  5. for /f "delims=" %%i in ('type "a.txt"') do (
  6.     set "line=%%i"
  7.     set str=!str!,!line!
  8. )
  9. >"a_New.txt" echo !str:~1!
复制代码
代码可以实现将文本每一行的内容加逗号变成一行,但是发现了一个问题,以上代码只能合并1000多条,后面就不能再合并了,这两天数据文本中的数量达到上万条时,就处理不了,麻烦大哥们帮忙改进一下,非常感谢,附件传不上来,附件a.txt的样例内容如下

链接:https://pan.baidu.com/s/1gtejPAwB02orYYo0uQRMSA?pwd=63sj
提取码:63sj
--来自百度网盘超级会员V5的分享

大概以后可能会处理有1万多行左右
作者: Batcher    时间: 2022-1-11 23:39

回复 11# seekbook


    4楼代码是否有问题?
作者: Batcher    时间: 2022-1-11 23:40

回复 11# seekbook


    如果需要上传文件,可以用阿里云盘或百度网盘。
作者: seekbook    时间: 2022-1-12 09:06

回复 12# Batcher


    是的,还是有问题,我在原稿里把附件传上来了
作者: 5i365    时间: 2022-1-12 09:21

回复 9# went


    大侠, 如果病例.txt文件的编码有多种情况, 后面生成的文件会有乱码, 怎样彻底解决? 我新开了一贴讨论
http://www.bathome.net/thread-61288-1-1.html
作者: seekbook    时间: 2022-1-14 13:27

(已解决感谢大家)
麻烦管理员将此贴标记一下谢谢




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2