找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 58400|回复: 14

[文件操作] Word、Excel文件转文本文件:doctotext_0.12.0

[复制链接]
发表于 2011-1-28 15:38:56 | 显示全部楼层 |阅读模式
MS Word format (DOC、DOCX), MS Excel format (XLS、XLSX), Rich Text Format (RTF), OpenDocument (ODF) and Office Open XML (OOXML, OpenXML or MSOOXML) documents to plain text converter. Can convert corrupted documents even if other recovery methods failed.
  1. doctotext 1.doc >1.txt
复制代码
发布日期:2010-08-04
下载地址:http://sourceforge.net/projects/doctotext/
发表于 2011-1-28 15:56:36 | 显示全部楼层
楼主这个转word的txt文本好象是unecode的。。。
 楼主| 发表于 2011-1-28 16:03:41 | 显示全部楼层

回复 2楼 的帖子

我测试的结果是UTF-8
Vista SP2 + Office 2007
发表于 2011-1-29 13:14:52 | 显示全部楼层
可能有些版本不同。。上次我转了一个是GB2312的。。。
发表于 2011-11-3 21:37:46 | 显示全部楼层
下载下来是一个压缩包,里面没有  .exe文件,运行doctotext.cpp出错了。应该怎么用?
发表于 2011-11-4 18:13:49 | 显示全部楼层
也需要自行COMPILE~
发表于 2011-11-17 22:43:32 | 显示全部楼层
我也没成功我用的wps
发表于 2012-10-20 15:10:13 | 显示全部楼层
回复 7# fanfande


    看顶楼的介绍没有提到支持WPS
发表于 2012-11-7 18:52:11 | 显示全部楼层
回复 5# QIAOXINGXING


    先编译,链接生成  .exe文件
发表于 2012-11-7 22:22:56 | 显示全部楼层
回复 9# ozzw11411o


    多谢了!!!!!
发表于 2012-11-8 08:49:19 | 显示全部楼层
中文文件名需要转换成 UTF-8 字符才能转换。

如果需要转换中文文件名(及批量转换),将附件中的文件(doctotext_.bat 和 win_iconv.exe)解压到 doctotext.exe 所在目录,之后的操作如下:
  1. doctotext_ 测试.doc
复制代码
  1. doctotext_ *.doc
复制代码
结果将输出到 原文件名.txt 中。

doctotext_.bat:
  1. @echo off
  2. setlocal
  3. set n=0
  4. set skip=

  5. dir /b %* | win_iconv -f gbk -t utf-8 >"%~f0.tmp"

  6. for /f "delims=" %%a in (' dir /b %* ') do (
  7.     call :doctotext "%%a"
  8. )
  9. exit /b

  10. :doctotext
  11. if %n% neq 0 (
  12.     set skip=skip=%n%
  13. )

  14. for /f "usebackq %skip% eol=< delims=" %%a in ("%~f0.tmp") do (
  15.     echo convert %1...
  16.     doctotext "%%a" >"%~1.txt"
  17.     set /a n += 1
  18.     goto :eof
  19. )
复制代码
发表于 2014-7-30 19:16:29 | 显示全部楼层
中文文件名需要转换成 UTF-8 字符才能转换。

如果需要转换中文文件名(及批量转换),将附件中的文件(d ...
tmplinshi 发表于 2012-11-8 08:49



    正在找转码的东东,看到了这个,谢谢!!!
发表于 2014-9-1 11:53:25 | 显示全部楼层
怎么样用DocToText批量转换多个文件夹内(包括子目录)的DOC为TXT呢,都是中文文档
发表于 2014-9-13 21:34:21 | 显示全部楼层
xiexiexiexie!!
发表于 2024-1-5 15:10:27 | 显示全部楼层
这个怎么用
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-16 23:23 , Processed in 0.018883 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表