找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 82921|回复: 20

[文件操作] [已解决] 批处理怎样找出两个文件中含有相同信息的行?

[复制链接]
发表于 2012-3-14 16:23:30 | 显示全部楼层 |阅读模式
本帖最后由 sweet惜缘 于 2012-3-19 23:22 编辑

一个文件file1.xls内容为:
  ZINC_ID            MWT         LogP      apolar
ZINC00000012   289.356     1.28      4.89
ZINC00000016    256.753    2.67      6.43
ZINC00000017     281.337    1.33     3.07
...
...
另一个文件file2.xls内容为:
ZINC_ID                time        Anchors   Orientations
ZINC00000012      32            1              500
ZINC00000016       9             1               500
...
...
其中file1.xls的内容比file2.xls的内容多,并且两个文件内容都很大,约300M
现在需要在file1.xls中找出ZINC_ID与file2.xls中ZINC_ID相同的行的信息,并把这些信息另外保存起来。例如file2.xls中的ZINC00000012,则把file1.xls中“ZINC00000012 289.356 1.28 4.89”提取并保存。本来想用数据库关联做的,但由于文件太大和格式问题,不能导入数据库,所以只好求助。谢谢各位帮忙。

评分

参与人数 1PB +2 收起 理由
zqz0012005 + 2 感谢给帖子标题标注[已解决]字样

查看全部评分

发表于 2012-3-14 16:28:30 | 显示全部楼层
excel转到sql server不是只要导入吗?除了这几列外还有其他东西?
用数据库应该会快很多
发表于 2012-3-14 19:10:03 | 显示全部楼层
导入数据库的时候格式有什么问题?
发表于 2012-3-14 21:10:17 | 显示全部楼层
文件那么大,不知道ADO能否胜任。结果保存在result.csv。
  1. @set @n=0//&cscript.exe -e:jscript "%~f0"&pause&exit/b

  2. file1 = "file1.xls";
  3. file2 = "file2.xls";

  4. strConnect = 'Provider=Microsoft.Jet.OLEDB.4.0;Data Source="' + file1
  5.     + '";Extended Properties="Excel 8.0;IMEX=1;HDR=yes;";';
  6. AdoCnn = new ActiveXObject("ADODB.Connection");
  7. AdoCnn.ConnectionString = strConnect;
  8. AdoCnn.Open();
  9. AdoRs = new ActiveXObject("ADODB.Recordset");
  10. AdoRs.Open("SELECT a.* from ["+file1+"].[Sheet1$] as a inner join ["+file2
  11.     +"].[Sheet1$] as b  ON (a.[ZINC_ID]=b.[ZINC_ID])", AdoCnn, 3);
  12. s = AdoRs.GetString(2, AdoRs.RecordCount, ",", "\r\n");
  13. AdoRs.Close();
  14. AdoCnn.Close();

  15. fso = new ActiveXObject("Scripting.FileSystemObject");
  16. fso.OpenTextFile('result.csv', 2, true).write(s);
复制代码
 楼主| 发表于 2012-3-15 13:14:09 | 显示全部楼层
回复 3# find

不好意思,执行不了。提示:Microsoft JET Datebase Engine:外部表不是预期的格式。我现在把文件的一部分传上来,麻烦您看看,谢谢!
 楼主| 发表于 2012-3-15 13:16:21 | 显示全部楼层
回复 3# find

我也不清楚,不知是文件太大还是其他问题。我传一部分文件,麻烦您看看。谢谢您的帮忙。
发表于 2012-3-15 21:57:18 | 显示全部楼层
楼主都会玩数据库了,怎么还连xls文件与文本文件都分不清楚?
file1.xls只是文本文件;file2.xls才是正宗的xls文件,而且列名称不是ZINC_ID而是Molecule。

  1. @set @n=0//&cscript.exe -e:jscript "%~f0"&pause&exit/b

  2. f1 = "file1.xls";
  3. f2 = "file2.xls";

  4. fso = new ActiveXObject("Scripting.FileSystemObject");
  5. csv = fso.GetBaseName(f1) + ".csv";
  6. fso.MoveFile(f1, csv);
  7. ts = fso.OpenTextFile("Schema.ini", 2, true);
  8. ts.WriteLine("["+csv+"]\r\nFormat=TabDelimited\r\n"); ts.Close();

  9. strConnect = 'Provider=Microsoft.Jet.OLEDB.4.0;Data Source="' + '.'
  10.     + '";Extended Properties="text;FMT=Delimited;HDR=yes;";';
  11. strQuery = "SELECT a.* from ["+csv+"] as a "
  12.     + " inner join (select Molecule from [查询1$]"
  13.     + " in '' [Excel 8.0;IMEX=1;HDR=yes;DATABASE="+f2+";]) as b "
  14.     + " ON (a.[ZINC_ID]=b.[Molecule])";
  15. AdoCnn = new ActiveXObject("ADODB.Connection");
  16. AdoCnn.Open(strConnect);
  17. AdoRs = AdoCnn.Execute(strQuery);
  18. s = AdoRs.GetString(2, -1, ",", "\r\n");
  19. AdoCnn.Close();

  20. fso.OpenTextFile('result.csv', 2, true).write(s);
  21. fso.MoveFile(csv, f1);
  22. fso.DeleteFile("Schema.ini");
复制代码

评分

参与人数 1技术 +1 收起 理由
zqz0012005 + 1 乐于助人

查看全部评分

发表于 2012-3-16 22:33:45 | 显示全部楼层
原来楼主在这个问题上纠结了这么久,呵呵。
http://www.bathome.net/viewthread.php?tid=15247
http://www.bathome.net/viewthread.php?tid=14847
http://www.bathome.net/viewthread.php?tid=14986
可是你的求助态度有点让人不敢恭维,不与答复者回馈,没有一点认真的态度,有点像拿到答案就跑的人。
 楼主| 发表于 2012-3-17 16:24:59 | 显示全部楼层
回复 8# powerbat


    对不起啊,这的确是我的问题,没养成答谢的习惯,我一定虚心接受您的批评,一定改正。这的确是一个不错的论坛,在这不但能学到好多知识,还能遇到您们这么多耐心帮助我们这些有问题的人,还能学到做人的道理。谢谢您们的无私奉献!但现在这个问题还没解决运行结果提示:“BOF或EOF有一个是真,或者当前的记录一倍删除,所需的操作要求一个当前的记录。”我看不懂代码,也改不了,所以还需要您的帮忙。我一直想学批处理,但找不到好的教材,麻烦您给我推荐个学习的教材。又麻烦您了,真诚的谢谢您!
发表于 2012-3-17 16:52:08 | 显示全部楼层
回复 9# sweet惜缘


只看批处理的教程永远搞不懂那个代码,因为它其实是VBS,可以到VBS版块找几个教程学学。
发表于 2012-3-17 19:29:57 | 显示全部楼层
把cmd窗口中的出错信息贴出来。

附:
如何在CMD中使用复制粘贴功能
http://www.bathome.net/thread-9963-1-1.html
 楼主| 发表于 2012-3-17 21:25:34 | 显示全部楼层
回复 11# powerbat


  错误提示:“ \Users\Administrator\Desktop\批处理.bat(21, 1) ADODB.Recordset: BOF 或 EOF 中
一个是“真”,或者当前的记录已被删除,所需的操作要求一个当前的记录。”又要麻烦您了。谢谢!
 楼主| 发表于 2012-3-17 21:26:41 | 显示全部楼层
回复 10# find


    谢谢提示,我去学学VBS!
发表于 2012-3-17 21:46:16 | 显示全部楼层
回复 12# sweet惜缘

我的win7上测试OK。
不行换这个试试

  1. @set @n=0//&cscript.exe -e:jscript "%~f0"&pause&exit/b

  2. f1 = "file1.xls";
  3. f2 = "file2.xls";

  4. fso = new ActiveXObject("Scripting.FileSystemObject");
  5. csv = fso.GetBaseName(f1) + ".csv";
  6. fso.MoveFile(f1, csv);
  7. ts = fso.OpenTextFile("Schema.ini", 2, true);
  8. ts.WriteLine("["+csv+"]\r\nFormat=TabDelimited\r\n"); ts.Close();

  9. strConnect = 'Provider=Microsoft.Jet.OLEDB.4.0;Data Source="' + '.'
  10.     + '";Extended Properties="text;FMT=Delimited;HDR=yes;";';
  11. strQuery = "SELECT a.* from ["+csv+"] as a "
  12.     + " inner join (select Molecule from [查询1$]"
  13.     + " in '' [Excel 8.0;IMEX=1;HDR=yes;DATABASE="+f2+";]) as b "
  14.     + " ON (a.[ZINC_ID]=b.[Molecule])";
  15. AdoCnn = new ActiveXObject("ADODB.Connection");
  16. AdoCnn.Open(strConnect);
  17. AdoRs = new ActiveXObject("ADODB.Recordset");
  18. AdoRs.Open(strQuery, AdoCnn, 3);
  19. s = AdoRs.GetString(2, -1, ",", "\r\n");
  20. AdoRs.Close();
  21. AdoCnn.Close();

  22. fso.OpenTextFile('result.csv', 2, true).write(s);
  23. fso.MoveFile(csv, f1);
  24. fso.DeleteFile("Schema.ini");
复制代码

评分

参与人数 1技术 +1 收起 理由
zqz0012005 + 1 乐于助人

查看全部评分

发表于 2012-3-18 01:03:50 | 显示全部楼层
回复 10# find


   
-e:jscript
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 21:12 , Processed in 0.022262 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表