- 帖子
- 378
- 积分
- 761
- 技术
- 2
- 捐助
- 0
- 注册时间
- 2008-11-24
|
【完结】50元求文字提取
本帖最后由 lxh623 于 2023-4-28 06:56 编辑
当前文件夹有许多子文件夹,其下都有子文件夹OEBPS,OEBPS下又有子文件夹juans。子文件夹juans含有一个或者多个xhtml文件。
在子文件夹juans的每一个xhtml文件中,用正则表达式提取<span class\="text\_2"><span class\="corr">(.{1,2})<\/span>,把提取的文本\1写入在子文件夹juans中新建的Cbeta.txt,编码是UTF-8,一行一个。
谢谢! |
|