[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] [已解决]求助批处理查找多音字替换对应拼音及拼音缩写的方法

本帖最后由 thp2008 于 2023-10-24 15:41 编辑

DuoYinZi.txt
藏,zang,Z
.......

BirdNamePYSX.txt内容示例如下:
花尾榛鸡,Hua Wei Zhen Ji ,HWZJ
黑琴鸡,Hei Qin Ji ,HQJ
雪鹑,Xue Chun ,XC
黄喉雉鹑,Huang Hou Zhi Chun ,HHZC
藏雪鸡,Cang Xue Ji ,CXJ
石鸡,Shi Ji ,SJ
大石鸡,Da Shi Ji ,DSJ
斑翅山鹑,Ban Chi Shan Chun ,BCSC
高原山鹑,Gao Yuan Shan Chun ,GYSC
.......

要求根据DuoYinZi.txt中的内容格式,将BirdNamePYSX.txt里,对应汉字的位置,对应拼音和拼音缩写进行替换。

如上例替换后,应该为:
藏雪鸡,Zang Xue Ji ,ZXJ

替换后,生成一个新文本文件保存即可。
主要是要确定汉字的位置,拼音的对应位置,缩写的字母的位置,才能进行对应替换,不知道怎么处理。
还请高手指导一下。

感谢!
1

评分人数

    • Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

感谢idwma的帮助,我测试了一下,报错信息如下,很长,我截取了一段
iex : 所在位置 行:2 字符: 18
+ $c=$b[1]-split ' '
+                  ~
字符串缺少终止符: '。
所在位置 行:2 字符: 18
+ $c=$b[1]-split ' '
+                  ~
表达式或语句中包含意外的标记“'
0..($b[0].length-1)|%{$h[$b[0][$_]]=$c[$_]}”。
所在位置 D:\Birds\test.ps1:15 字符: 5
+     iex $f
+     ~~~~~~
    + CategoryInfo          : ParserError: ( [Invoke-Expression], ParseException
    + FullyQualifiedErrorId : TerminatorExpectedAtEndOfString,Microsoft.PowerShell.Commands.InvokeExpressionCommand

无法对 Null 数组进行索引。
所在位置 D:\Birds\test.ps1:16 字符: 5
+     $arr+=,$b[0]
+     ~~~~~~~~~~~~
    + CategoryInfo          : InvalidOperation: (:) [],RuntimeException
    + FullyQualifiedErrorId : NullArray

iex : 所在位置 行:2 字符: 18
+ $c=$b[1]-split ' '
+                  ~
字符串缺少终止符: '。
所在位置 行:2 字符: 18
+ $c=$b[1]-split ' '
+                  ~
表达式或语句中包含意外的标记“'
0..($b[0].length-1)|%{$h[$b[0][$_]]=$c[$_]}”。
所在位置 D:\Birds\test.ps1:15 字符: 5
+     iex $f
+     ~~~~~~
    + CategoryInfo          : ParserError: (:) [Invoke-Expression], ParseException
    + FullyQualifiedErrorId : TerminatorExpectedAtEndOfString,Microsoft.PowerShell.Commands.InvokeExpressionCommand

无法对 Null 数组进行索引。
所在位置 D:\Birds\test.ps1:16 字符: 5
+     $arr+=,$b[0]
+     ~~~~~~~~~~~~
    + CategoryInfo          : InvalidOperation: (:) [],RuntimeException
    + FullyQualifiedErrorId : NullArray

TOP

本帖最后由 thp2008 于 2023-10-24 10:20 编辑
77七 发表于 2023-10-24 08:29


测试基本可以。非常感谢!高手。

1、只是两点小问题,因为文本文件里,有些汉字较生僻,用ANSI保存,这部分汉字就会乱码,只能用UTF-8保存才不会乱码.
2、就是拼音缩写部分,我原来拼音缩写部分全是大写字母,替换后,全部变成了小写字母。拼音部分小写没关系。

TOP

本帖最后由 thp2008 于 2023-10-24 14:10 编辑
回复  thp2008


   已在4楼修改。
77七 发表于 2023-10-24 10:37


感谢!我测试了一下,1、UTF-8编码,没有问题了。
2、大写的问题,输出变成了这样显示  藏雪鸡,Zang xue ji ,Zxj  正确应该是 : 藏雪鸡,zang xue ji ,ZXJ 其它的缩写还是小写。而且其它没有被替换的拼音缩写也全部变成了小写。或者你能不能在替换完成后,将最后的所有拼音缩写转换为大写,就可以了。

TOP

返回列表