- 帖子
- 302
- 积分
- 448
- 技术
- 2
- 捐助
- 0
- 注册时间
- 2015-4-10
|
本帖最后由 thp2008 于 2023-6-21 11:14 编辑
比如,我有两个文本文件,yuanshi.txt new.txt
yuanshi.txt 是比较全的里面都是汉字名称,没有其它字符。
想将new.txt里的所有行跟yuanshi.txt里的所有行进行比较,删除掉new.txt里面,在yuanshi.txt里已存的行,
最终输出的结果,new.txt里只保留yuanshi.txt里不存在的行。或者将new.txt里在yuanshi.txt中这些不存在的行,单独输出到另一个文件也行。
示例:
yuanshi.txt
波尔多
勃艮第
香槟区
罗纳河谷
卢瓦尔河谷
阿尔萨斯
西南产区
朗格多克鲁西荣
威尼托
安布里亚
阿布鲁佐
皮尔蒙特
坎帕尼亚
维罗纳
new.txt
卢瓦尔河谷
普罗旺斯科西嘉
阿尔萨斯
西南产区
朗格多克鲁西荣
托斯卡纳
西西里岛
威尼托
比对后,输出结果:
普罗旺斯科西嘉
托斯卡纳
西西里岛
另外,我还发现了一个问题。
本来我想把TXT全部保存为ANSI来操作的,但我发现,有少量汉字,不能保存为ANSI,否则显示为??
比如:䴙、䴘、类似这种汉字,就不行,但保存为UTF-8就不会乱码,问题又来了,保存为UTF-8,命令行下,就显示乱码。
只要能完成,比较这两个文本文件的行就行,不管用什么方式,第三方工具也行,我需要的是结果。
这两个问题,该如何处理。感谢大家。 |
-
1
评分人数
-
|