[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]如何改进这段批量合并删除文章批处理(数据丢失)?

  1. @echo off
  2. md worktemp 2>nul
  3. cd.>worktemp\temp.txt
  4. for %%a in ("%~1\*.txt") do (
  5.   set/a n+=1
  6.   setlocal enabledelayedexpansion
  7.   title 正在处理第!n!个文件..
  8.   endlocal
  9.   if %%~za lss 1000 (del /q /f "%%a") else (
  10.     if %%~za lss 4000 copy "%%a"+"worktemp\temp.txt" "worktemp\temp.txt"&&del /f /q "%%a"
  11.     for %%b in (worktemp\temp.txt) do if %%~zb geq 4000 move %%~fsb "%~1\%%nxa"
  12.   )
  13. )
  14. rd /s /q worktemp
复制代码
这是个大大帮我写的文本处理 作用如下
1:是删除文件夹内少于2KB的TXT文本  2是自动合并2KB-4KB的TXT文章  3.就是自动调用一个TXT文章的标题作为合并后的TXT标题! 4嘛就是收尾 删除生成临时的文件夹   
但是现在有个问题 就是会丢失数据  比如我一个文件夹里的文章数量是好几W  一般都在2W以上  但是处理出来的文章才几百 上千。。。绝对不可能这么少。。。。。尤其是对中文文章支持最不理想 有时候直接全部丢失 几百都不留给你!
PS:我要处理的文章有很多国家的语言。。。一遍是英文和中文多点  还有法文  波斯语  日文这样
处理英文文章的话  好像数据丢失比较没那么严重。。。。。。。。
1

评分人数

    • CrLf: 感谢给帖子标题标注[已解决]字样PB + 2

你的文件是不是有些用的unicode或者utf-8编码?
1

评分人数

    • CrLf: 乐于助人PB + 3

TOP

回复 2# awk


    这个不清楚 怎么看。。。。。

TOP

回复 3# yiduancang


用记事本打开其中一个文件,在菜单栏选择“文件”,“另存为”,就能看到编码类型了。
1

评分人数

    • CrLf: 乐于助人PB + 3
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

没有    全部是ANSI

TOP

返回列表