批量版本的- import os
-
- # 创建 output 子目录
- if not os.path.exists('output'):
- os.mkdir('output')
-
- # 获取当前目录下的所有 *.txt 文件
- txt_files = [filename for filename in os.listdir() if filename.endswith('.txt')]
-
- for input_file in txt_files:
- # 确保输入文件存在
- try:
- with open(input_file, 'r', encoding='utf-8') as file:
- lines = file.readlines()
- except FileNotFoundError:
- print(f"文件 '{input_file}' 不存在,请确保文件名正确。")
- continue
-
- # 创建输出文件名
- output_file = os.path.join('output', input_file.replace('.', '-BuCF.'))
-
- # 去除重复行并保存到输出文件,保持原始顺序
- unique_lines = []
- seen = set()
- for line in lines:
- if line not in seen:
- unique_lines.append(line)
- seen.add(line)
-
- with open(output_file, 'w', encoding='utf-8') as file:
- file.writelines(unique_lines)
-
- print(f"已去除重复行并保存到 'output/{output_file}' 文件中。")
复制代码
|