找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 57099|回复: 15

[文本处理] 求批处理提取文本内容的方式,可能要正则

[复制链接]
发表于 2021-7-28 01:44:20 | 显示全部楼层 |阅读模式
比如
静夜思作者:李白床前明月光疑是地上霜举头望明月低头思故乡

需要提取单字段是

作者:李白
作者后面可能是三个字比如白居易

有没有办法

是在一个TXT里面有大量的这种诗句,要提取作者
发表于 2021-7-28 02:04:17 | 显示全部楼层
如果要智能提取作者的话,要分情况,全是五言绝句还是有其它的?
发表于 2021-7-28 07:50:42 | 显示全部楼层
回复 2# went


    全是五言绝句,位置比较固定
发表于 2021-7-28 08:44:11 | 显示全部楼层
如果行尾不存在空白字符。
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. for /f "delims=" %%a in ('findstr /r "作者" a.txt') do (
  4. set str=%%a
  5. set str=!str:*作者=作者!
  6. set str=!str:~0,-20!
  7. echo,!str!
  8. )
  9. pause
复制代码
发表于 2021-7-28 08:57:23 | 显示全部楼层
回复 4# qixiaobin0715


    这个 ~0,-20啥意思
发表于 2021-7-28 09:07:45 | 显示全部楼层
发表于 2021-7-28 09:27:06 | 显示全部楼层
回复 5# zztxbat


参考set命令教程第8页
http://bbs.bathome.net/thread-31727-1-1.html
发表于 2021-7-28 09:59:25 | 显示全部楼层
回复 5# zztxbat
你真厉害,上来一次注册一次。
发表于 2021-7-28 10:31:55 | 显示全部楼层
回复 4# qixiaobin0715


    试了下发现不行
发表于 2021-7-28 10:51:45 | 显示全部楼层
回复 9# zztxbat


请参考Q-01观察一下哪行代码在报错以及详细的报错信息:
https://mp.weixin.qq.com/s/6lbb97qUOs1sTyKJfN0ZEQ

如果仍然看不到报错信息,请把你测试用的文件和bat脚本打包上传到网盘以便他人帮忙排查。
发表于 2021-7-29 13:53:32 | 显示全部楼层
本帖最后由 autoav 于 2021-7-29 13:55 编辑

一个txt里,我觉得用emeditor这种软件更方便,利用正则表达式,实时查看每一步操作,且可以撤销。
批处理的优点还是大量文件的简单处理
发表于 2021-7-29 13:57:23 | 显示全部楼层
回复 11# autoav
多个文件也可,写个宏文件即可。
发表于 2021-7-29 15:52:04 | 显示全部楼层
回复  autoav
多个文件也可,写个宏文件即可。
qixiaobin0715 发表于 2021-7-29 13:57

是的,批处理不直观,不可撤销,只适合大量文件的简单处理
发表于 2021-7-29 21:32:51 | 显示全部楼层
回复 13# autoav
可是一般来说批处理处理文本时,是在副本上进行的,即使有问题也不会对源文件造成影响,不存在恢复问题,除非有意进行控制。
发表于 2021-8-2 11:04:07 | 显示全部楼层
回复  autoav
可是一般来说批处理处理文本时,是在副本上进行的,即使有问题也不会对源文件造成影响,不存 ...
qixiaobin0715 发表于 2021-7-29 21:32



    我用批处理,经常是大量文件,基本上都是反复确认,一旦执行后,不会留底,当然也都是小说,真的错了,也不会引起大问题。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-20 21:11 , Processed in 0.037104 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表