标题: [文本处理] [已解决]如何改进这段批量合并删除文章批处理(数据丢失)? [打印本页]
作者: yiduancang 时间: 2011-12-23 16:06 标题: [已解决]如何改进这段批量合并删除文章批处理(数据丢失)?
- @echo off
- md worktemp 2>nul
- cd.>worktemp\temp.txt
- for %%a in ("%~1\*.txt") do (
- set/a n+=1
- setlocal enabledelayedexpansion
- title 正在处理第!n!个文件..
- endlocal
- if %%~za lss 1000 (del /q /f "%%a") else (
- if %%~za lss 4000 copy "%%a"+"worktemp\temp.txt" "worktemp\temp.txt"&&del /f /q "%%a"
- for %%b in (worktemp\temp.txt) do if %%~zb geq 4000 move %%~fsb "%~1\%%nxa"
- )
- )
- rd /s /q worktemp
复制代码
这是个大大帮我写的文本处理 作用如下
1:是删除文件夹内少于2KB的TXT文本 2是自动合并2KB-4KB的TXT文章 3.就是自动调用一个TXT文章的标题作为合并后的TXT标题! 4嘛就是收尾 删除生成临时的文件夹
但是现在有个问题 就是会丢失数据 比如我一个文件夹里的文章数量是好几W 一般都在2W以上 但是处理出来的文章才几百 上千。。。绝对不可能这么少。。。。。尤其是对中文文章支持最不理想 有时候直接全部丢失 几百都不留给你!
PS:我要处理的文章有很多国家的语言。。。一遍是英文和中文多点 还有法文 波斯语 日文这样
处理英文文章的话 好像数据丢失比较没那么严重。。。。。。。。
作者: awk 时间: 2011-12-23 17:32
你的文件是不是有些用的unicode或者utf-8编码?
作者: yiduancang 时间: 2011-12-23 17:41
回复 2# awk
这个不清楚 怎么看。。。。。
作者: Batcher 时间: 2011-12-23 19:29
回复 3# yiduancang
用记事本打开其中一个文件,在菜单栏选择“文件”,“另存为”,就能看到编码类型了。
作者: yiduancang 时间: 2011-12-26 19:56
没有 全部是ANSI
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |