找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
楼主: sweet惜缘

[问题求助] 【已解决】gawk如何提取并统计文本里的特定内容

[复制链接]
 楼主| 发表于 2015-3-29 10:28:22 | 显示全部楼层
回复 14# DAIC


    不能··因为是MAT格式的。。。。
发表于 2015-3-29 14:51:46 | 显示全部楼层
回复 16# sweet惜缘


    你的mat压缩成.rar或者.zip之后,上传到论坛的时候报什么错?
 楼主| 发表于 2015-3-30 10:03:11 | 显示全部楼层
回复 17# DAIC
忘记还可以这样了。。。
 楼主| 发表于 2015-3-30 10:51:29 | 显示全部楼层
本帖最后由 sweet惜缘 于 2015-3-30 15:27 编辑

回复 13# bailong360

大神~我今早试了下~分类和计数可以用~~~昨天可能没操作好~但现在有一个小问题~~
有的搜集出来没有搜到TC number~但事实上是有的~
D02217
REMARK      Therapeutic category: 3999
            ATC code: G03XC01
            Drug group: DG00476
比如说这个就有TC Number~但是我们没有搜集出来

大神给的统计数据的统计出来结果如下
拥有ATC code的药物有2307种     事实上分别应该是~4707
拥有Drug group的药物有3860种                               5013

拥有Therapeutic category的药物有742种                2412

拥有PATHWAY的药物有3500种                                  3501
似乎只有pathway搜集的比较全~~如何能够搜集的更全一些呢

万分感谢~~~祝好运~
发表于 2015-3-30 23:43:53 | 显示全部楼层
回复 19# sweet惜缘


    已修改
如果想要得到的代码更完美,建议在顶楼附上有代表性的样本,样本过大的话可以传到百度云之类上然后在顶楼给出链接
这样在调试代码的过程中就能知道有没有取到所有情况
 楼主| 发表于 2015-3-31 08:35:45 | 显示全部楼层
本帖最后由 sweet惜缘 于 2015-4-1 10:38 编辑

回复 20# bailong360
已上传到网盘~~大神~~~您这次修改的程序只能提取出600+的药物~难道是数据量太大的原因吗
望指点~
万分感谢!!
发表于 2015-3-31 23:34:43 | 显示全部楼层
回复 21# sweet惜缘


    测试了一下,上一个版本除了PATHWAY以外应该都收集全了

目前版本对给出的文件除了PATHWAY依然为3500以外其它的都收集完全了
 楼主| 发表于 2015-4-1 10:38:37 | 显示全部楼层
本帖最后由 sweet惜缘 于 2015-4-1 10:40 编辑

回复 22# bailong360


    谢拉~~万分感谢~~很好用!好人一生平安~~·
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-16 22:22 , Processed in 0.017920 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表