找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 23345|回复: 4

[文本处理] [已解决]提取文本指定内容出现乱码如何解决?

[复制链接]
发表于 2016-3-20 08:28:30 | 显示全部楼层 |阅读模式
本帖最后由 pcl_test 于 2016-3-20 14:12 编辑

实例:新建的文本,粘贴的汉字内容,然后提取关键字,结果里有部分乱码。win7
  1. type 大秦帝国1.txt | find /i "第" | find /i "节">>a.ini
复制代码
代码如上,仅如此。百思不得其姐。
先谢谢了。
如需原文,地址在下
大秦帝国1

评分

参与人数 1PB -2 收起 理由
pcl_test -2 勿发笼统的标题

查看全部评分

发表于 2016-3-20 08:57:55 | 显示全部楼层
本帖最后由 codegay 于 2016-3-20 09:48 编辑

python
  1. with open("大秦帝国1黑色裂变 (1).txt",encoding="cp936") as f:
  2.     ini=[r for r in f if "第"in r and "章" in r and "节" in r]
  3. with open("result.ini","w+") as f:
  4.     f.writelines(ini)
复制代码
受楼下的启发,用了str.startswith()
  1. with open("大秦帝国1黑色裂变 (1).txt",encoding="cp936") as f:
  2.     ini=[r for r in f if r.startswith("第") and "章" in r and "节" in r]
  3. with open("result.ini","w+") as f:
  4.     f.writelines(ini)
复制代码

评分

参与人数 2技术 +2 收起 理由
hlzj88 + 1 乐于助人
happy886rr + 1 乐于助人

查看全部评分

 楼主| 发表于 2016-3-20 09:17:07 | 显示全部楼层
谢谢,有没有bat的解决办法呢
发表于 2016-3-20 09:35:28 | 显示全部楼层
本帖最后由 pcl_test 于 2016-3-20 14:12 编辑

回复 3# hlzj88
  1. findstr "^第.*章.*第.*节.*" <大秦帝国1黑色裂变.txt>2.txt
复制代码

评分

参与人数 3PB -2 技术 +2 收起 理由
hlzj88 + 1 乐于助人
pcl_test -2 结果不需要贴出来
codegay + 1 1

查看全部评分

发表于 2016-3-20 10:21:59 | 显示全部楼层
  1. findstr "第..节" 大秦帝国1黑色裂变.txt>a.ini
复制代码

评分

参与人数 1技术 +1 收起 理由
hlzj88 + 1 乐于助人

查看全部评分

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 01:40 , Processed in 0.014430 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表