本帖最后由 lxh623 于 2020-9-12 07:42 编辑
http://www.bathome.net/thread-56119-1-1.html
上次求了一次,觉得不够用。
第一,上一次的加上一个字段——篇名。(xml名字)有时候想找字。
第二,关于悉昙字和兰札字。- <char xml:id="SD-A442">
- <charName>CBETA CHARACTER SD-A442</charName>
- <charProp>
- <localName>Romanized form in CBETA transcription</localName>
- <value>ki</value>
- </charProp>
- <charProp>
- <localName>Character in the Siddham font</localName>
- <value>丁</value>
- </charProp>
- <charProp>
- <localName>Romanized form in Unicode transcription</localName>
- <value>ki</value>
- </charProp>
- <mapping cb:dec="1066050" type="PUA">U+104442</mapping>
- </char>
- <char xml:id="RJ-CAC5">
- <charName>CBETA CHARACTER RJ-CAC5</charName>
- <charProp>
- <localName>Romanized form in CBETA transcription</localName>
- <value>hri</value>
- </charProp>
- <charProp>
- <localName>rjchar</localName>
- <value>岒</value>
- </charProp>
- <charProp>
- <localName>Romanized form in Unicode transcription</localName>
- <value>hri</value>
- </charProp>
- <mapping cb:dec="1100485" type="PUA">U+10CAC5</mapping>
- </char>
复制代码 第一个来自于T21n1320,第二个是T21n1419。
除了篇名,字符名,还有四个值。
还想要一个值,就是正文,得到字符名称后,搜索。比如,<g ref="#RJ-CB60">􌭠</g>或者<g ref="#SD-A44A">􄑊</g>。这一串或者中间的值,都可以。
结果当然需要UTF8。而且这个字符是乱码。仍然得到,主要是以后可以替换。
谢谢!
奇怪,浏览器乱码显示的数字大概就是最后一个字段括号内的数字,但是,替换的话,可能最好提取内容。 |