[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 在文本中取每行间部分字符并保存到新文件的批处理

001) www.91xinyu.com   新网站
002) www.Abniao.com    新网站
003) www.bysj999.com   新网站
004) www.bbf.net   新网站
005) www.eslylam.cn   新网站  
006) www.gmeeting.com   新网站  
有很多网站, 想删除001) 和.com还有之后的“新网站”, 比如第一行,只想留下91xinyu   第二行只要Abniao
练手的机会,可惜俺不懂!期待高手走过。

[ 本帖最后由 3887676 于 2009-6-7 01:04 编辑 ]

還是用gawk
  1. gawk -F"." "{print $2}" yourfile
复制代码

[ 本帖最后由 twfcc 于 2009-6-7 06:48 编辑 ]

TOP

2楼的貌似不行呀.运行了命了文件没有改变...

TOP

运行了命令文件没有改变...

TOP

我改成gawk -F"." "{print $2}" 1.txt>2.txt 运行以后,  仍有部分“新网站”这个词存在     请高手再想想办法。。

TOP

  1. @echo off&setlocal enabledelayedexpansion
  2. cd.>url_tmp.txt
  3. for /f "delims=" %%a in (1.txt) do set url=%%~na&echo !url:*www.=!>>url_tmp.txt
  4. start url_tmp.txt
复制代码

TOP

6楼的 能把“新网站”全部去掉了    但是却不能全部去005)  006)    这些序号,因为站有很多     请各位再研究一下

TOP

  1. @echo off
  2. for /f "tokens=2 delims=." %%i in (1.txt) do echo %%i
  3. pause
复制代码

TOP

8楼的代码也不行   出现和楼一样的情况   仍有部分“新网站”这个词存在

TOP

009) www.angedom.net  新网站
010) www.windv.net  新网站
011) www.ziyou.net  新网站
012) auto56.com  新网站
013) cqofice.com  新网站
014) futiachem.com  新网站
015) jxleth.com  新网站
016) laosi5.com  新网站
017) onlnb.com  新网站
018) pfslpper.com  新网站
019) bbs.wyou.com  新网站
020) *.l3.uyou.com (泛域名) 新网站
021) batome.cn  新网站
022) bbs.athome.cn  新网站
023) 0n.com.cn  新网站
024) ime.cn  新网站
025) onlnb.cn  新网站
026) angedom.net  新网站
027) winrv.net  新网站
028) bbs.wyou.net  新网站
029) zhiyu.net  新网站
030) *.becham.org (泛域名) 新网站
031) www.lt888.com  新网站
032) missormss.com  新网站
033) lts88.com  新网站
034) www.coffice.com  



这些做为例子   能清干净   任务就算完成了   要的效果

angedom
windv
ziyou
auto56
cqofice
futiachem
jxleth
laosi5
onlnb
pfslpper
wyou
uyou
batome
athome
0nime
onlnb
angedom
winrv
wyou
lt888
missormss
lts88
coffice

TOP

我上边根据1楼的例子给出的。按10楼要求重修改。还有其他的情况最好一起说明
  1. @echo off&setlocal enabledelayedexpansion
  2. cd.>url_tmp.txt
  3. for /f "tokens=2 delims=) " %%a in (1.txt) do set url=%%~na&set url=!url:*.=!&echo !url:*.=!>>url_tmp.txt
  4. start url_tmp.txt
复制代码

TOP

试试这个
sed "s/\(.*\)\..*/\1/;s/\.com//g;s/.*\.//g;s/.* //g" 1.txt|more>2.txt

TOP

11楼的代码在023) 0n.com.cn  新网站 这一行出错。

TOP

11楼   完美答案   先谢谢了   我要好好学习  向你们的程度努力啊

TOP

回复 14楼 的帖子

等等,没有考虑全
如果是 bbb.aaa.com.cn, bbb.ccc.net.cn
楼主是取 aaa  ccc 吗?

如是,12楼的正则是正确的。

TOP

返回列表