Board logo

标题: [文本处理] chatgtp写的批处理统计第一列重复3次或以上,错误在哪呢? [打印本页]

作者: 520pcl    时间: 2023-3-17 16:57     标题: chatgtp写的批处理统计第一列重复3次或以上,错误在哪呢?

data.txt中有许多行数据,每一行数据被空格分成前后两个部分,请你写一个批处理,逐一比较每一行数据的空格前的部分,如果某一行数据的空格前的部分,与其他行的空格前的部分重复次数≥3,则把此行空格后的部分保存到newdata.txt

上图是data.txt中的部分内容
下图是newdata.txt中的部分内容

上图是data.txt中的部分内容,下图是运行批处理后newdata.txt中应该呈现的数据
即空格前数据重复了三次的数据的空格后的部分
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. rem 读取文件中的每一行数据
  4. for /f "tokens=1,* delims= " %%a in (data.txt) do (
  5.     set "count=0"
  6.     rem 统计空格前的部分出现的次数
  7.     for /f "tokens=1,* delims= " %%c in (data.txt) do (
  8.      if "%%c"=="%%a" set /a count+=1
  9.     )
  10.     rem 判断是否出现次数≥3
  11.     if !count! geq 3 (
  12.      echo %%b>>newdata.txt
  13.     )
  14. )
  15. echo 执行完毕,结果保存在 newdata.txt 文件中。
  16. pause
复制代码
复制解释:

1. `setlocal enabledelayedexpansion`:启用延迟环境变量扩展,以便在循环中使用 `!` 操作符。

2. `for /f "tokens=1,* delims= " %%a in (data.txt) do`:逐行读取 `data.txt` 文件中的数据,使用空格作为分隔符,将每行数据分成两个部分,分别存储在 `%%a` 和 `%%b` 变量中。

3. `set "count=0"`:初始化计数器变量 `count`,用于统计空格前的部分出现的次数。

4. `for /f "tokens=1,* delims= " %%c in (data.txt) do`:再次循环读取 `data.txt` 文件中的数据,用于统计空格前的部分出现的次数。

5. `if "%%c"=="%%a" set /a count+=1`:如果当前行的空格前的部分与原始行的空格前的部分相同,则计数器加 1。

6. `if !count! geq 3 (`:判断计数器是否大于等于 3。

7. `echo %%b>>newdata.txt`:如果出现次数大于等于 3,将当前行的空格后的部分追加到 `newdata.txt` 文件中。

8. `pause`:程序暂停运行,等待用户按下任意键继续。

9. `setlocal`:结束延迟环境变量扩展。
作者: 520pcl    时间: 2023-3-17 16:59

这是另一个解答
以下是一个批处理脚本,适用于Windows操作系统,它可以实现你所要求的功能:

batch
@echo off
setlocal enabledelayedexpansion

if exist newdata.txt del newdata.txt

for /f "tokens=1,* delims= " %%a in (data.txt) do (
    set "key=%%a"
    set "value=%%b"
    set "count=0"

    for /f "tokens=1 delims= " %%x in ('findstr /b "!key! " data.txt') do (
        set /a "count+=1"
    )

    if !count! GEQ 3 (
        echo !value! >> newdata.txt
    )
)

endlocal

将此脚本保存为 `process_data.bat`,确保它与 `data.txt` 文件位于相同的目录中。然后双击运行该批处理脚本,它将按照你的要求处理 `data.txt` 中的数据,并将结果保存到 `newdata.txt` 文件中。
作者: 520pcl    时间: 2023-3-17 17:02

第三个解答
你好,我可以为你提供一些帮助。我可以提供一段批处理代码,用于比较`data.txt`中每一行数据的空格前的部分,如果某一行数据的空格前的部分,与其他行的空格前的部分重复次数≥3,则新建`newdata.txt`,把此行空格后的部分保存到`newdata.txt`:

@echo off
setlocal EnableDelayedExpansion

REM 创建一个新文件newdata.txt
echo > newdata.txt

REM 读取data.txt文件
for /f "tokens=1,2* delims= " %%a in (data.txt) do (
    set before=%%a
    set after=%%b

    REM 统计重复次数
    set count=0
    for /f "tokens=1* delims= " %%x in (data.txt) do (
        if "%%x"=="!before!" set /a count+=1
    )

    REM 如果重复次数≥3,则把此行空格后的部分保存到newdata.txt
    if !count! geq 3 echo !after! >> newdata.txt
)
作者: Batcher    时间: 2023-3-17 17:17

回复 1# 520pcl


请给一个真实的例子说明一下你的需求吧,比如操作之前是怎样的,操作之后变成啥样?
如果需要上传文件,可以用阿里云盘或百度网盘。

如果需要上传截图,可以找个图床,例如:
http://bbs.bathome.net/thread-60985-1-1.html
作者: 520pcl    时间: 2023-3-17 17:29

本帖最后由 520pcl 于 2023-3-17 17:35 编辑


上图是data.txt中的部分内容
下图是newdata.txt中的部分内容

上图是data.txt中的部分内容,下图是运行批处理后newdata.txt中应该呈现的数据
即空格前数据重复了三次的数据的空格后的部分
作者: jyswjjgdwtdtj    时间: 2023-3-17 17:46

是连续三次还是累计三次?
作者: 520pcl    时间: 2023-3-17 17:57

回复 6# jyswjjgdwtdtj


累计三次及三次以上,无需连续
作者: 77七    时间: 2023-3-17 18:04

我帮你试了前两个代码,都是没问题的。

注意下data.txt的编码格式和换行符吧,可以同时把编码格式改为ansi,换行符改为CR+LF试试
作者: 520pcl    时间: 2023-3-17 18:49

回复 8# 77七
谢谢,问题解决了,现在就是生成的newdata.txt中,插有几行“ECHO 处于关闭状态”的提示,不过这个问题不大,替换掉就好了
我把data.txt中的数据复制到为知笔记,然后复制回来,问题就解决了,我习惯用为知笔记解决编码格式问题
看来chatgtp还是很强大的,如果你需要测试chatgtp编写批处理的能力,回复我,我给你分享一个免费使用chatgtp的网址,无需fq
作者: 520pcl    时间: 2023-3-17 18:52

回复 9# 520pcl
第三个解答其实是另一个国外人工智能的解答,不是chatgtp的回答
作者: 77七    时间: 2023-3-17 19:20

回复 9# 520pcl


  
  1. echo.>newdata.txt
复制代码
代码开头可以换成这样,就不会有提示了
作者: 520pcl    时间: 2023-3-17 20:14

好的,免费chatgtp网址 https://www.cx32.com/ 但这个是3.0版 不是最新的4.0版本
作者: Batcher    时间: 2023-3-18 09:29

回复 9# 520pcl


echo %%b>>newdata.txt
改成这样试试:
echo,%%b>>newdata.txt
作者: Batcher    时间: 2023-3-18 09:33

回复 2# 520pcl


echo !value! >> newdata.txt
这种写法会导致:
1、行尾有多余的空格
2、变量值遇到 on 或 off 等关键字的时候会出错

改成这样比较好:
>> newdata.txt echo,!value!
作者: qixiaobin0715    时间: 2023-3-18 09:41

最起码现在来说,我还是不太相信chatgtp,还是自己写代码比较放心。如果不在乎文本原来的顺序的话:
  1. @echo off
  2. for /f "tokens=1*" %%i in ('type data.txt^|sort') do (
  3.     if "!str!"=="%%i" (
  4.         set /a n+=1
  5.         set _!n!=%%j
  6.     ) else (
  7.         if !n! geq 3 (
  8.             (for /f "tokens=1* delims==" %%a in ('set _') do (
  9.                 echo,%%b
  10.             )
  11.             echo,)>>newdata.txt
  12.             endlocal
  13.         )
  14.         setlocal enabledelayedexpansion
  15.         set n=1
  16.         set _1=%%j
  17.     )
  18.     set str=%%i
  19. )
  20. pause
复制代码

作者: 520pcl    时间: 2023-3-18 11:02

回复 13# Batcher


谢谢,改动后“ECHO 处于关闭状态”的提示没有了
作者: 520pcl    时间: 2023-3-18 11:05

回复 14# Batcher
好的,三个批处理其实都是可以运行的,第一个最快,第三个也比较快,第二个也比较慢,我就用第一个批处理
作者: 520pcl    时间: 2023-3-18 11:13

回复 15# qixiaobin0715


你这个也是可以完成任务的,但是空白行多了些,每三五行数据就有一个空白行,当然,替换一下就没问题了
作者: 520pcl    时间: 2023-3-18 11:23

回复 15# qixiaobin0715


    是的,批处理代码的威力还是很大的,保守起见我是在另一台电脑上测试的,但chatgtp写批处理能力还是比较强的
作者: 77七    时间: 2023-3-18 11:44

本帖最后由 77七 于 2023-3-18 12:01 编辑

我还以为是开头的代码出现了提示
也可以试试直接计数,可能快一点
  1. @echo off
  2. for /f "tokens=1-2" %%a in ('type "data.txt"') do (
  3.         set /a #%%a+=1
  4. )
  5. setlocal enabledelayedexpansion
  6. for /f "tokens=1-2" %%a in ('type "data.txt"') do (
  7.         if !#%%a! geq 3 (
  8.                 echo %%b
  9.         )
  10. )>>newdata.txt
  11. endlocal
  12. pause
复制代码
如果有空白行,或者产生提示,还是建议查看一下编码格式和换行符,你复制到云笔记再粘贴回去不一定完美解决问题...
作者: 520pcl    时间: 2023-3-18 12:58

回复 20# 77七


    谢谢,这段代码目前是最快的,为知笔记的特点是不管拷贝进去是什么格式,复制出来就是utf-8格式,之前不成功的时候我看了,data.txt就是ansi格式,后来去为知笔记复制回来其实是utf8,刚才试过了,data.txt是utf-8或ansi格式其实都可以运行。
其实这个代码很有用,data.txt是复制的excle中的某两个列,excle我不太熟,但好像用excle要实现这样的功能也是相当麻烦,干脆就保存为txt用批处理解决
作者: Batcher    时间: 2023-3-18 19:28

回复 17# 520pcl


第二个慢的原因是在for循环内部频繁调用外部命令findstr,每处理一行文本就会调用一次。
如果文本内容有很多行,这种慢会更加明显。
作者: 520pcl    时间: 2023-3-18 20:25

回复 22# Batcher


    好像批处理都是些年龄较大的人在用,年轻人好像不怎么会用批处理,要么不知道,要么看不上,可能去学python去了,其实批处理更简洁方便啊,是不是这样
作者: Batcher    时间: 2023-3-19 10:51

回复 23# 520pcl


我了解到的情况:
1、本论坛有不少年轻人、学生。
2、如果一个人毕业之后别的什么都不会,Python掌握的非常好,可以找到一个挺好的对口的工作;如果一个人毕业之后别的什么都不会,BAT掌握的非常好,几乎找不到工作;如果一个人毕业之后可以通过其他技能找到工作,同时又懂BAT或Python,有助于提升薪资。
作者: qixiaobin0715    时间: 2023-3-20 08:15

本帖最后由 qixiaobin0715 于 2023-3-20 08:22 编辑

回复 18# 520pcl
你没明白空白行是我故意留下的吗?不同组别之间以空行隔开,不想要空行的话,可以将代码第11行中“echo,”删除即可。
如果chatgtp真的像你说的那样神奇,大家何必在这里啰嗦呢。




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2