发布网友 发布时间:2024-10-24 13:58
共2个回答
热心网友 时间:2024-10-24 17:33
Python的脚本。
思路:读入每一行,然后按空格分出词,将以‘为‘开头的词及其前后的词组成索引值,在set中查找这个索引,如果没有则输出这一行并插入该索引。
注意:a.txt和b.txt必须用utf-8编码保存。
# coding: utf-8
import re
af = open('a.txt')
bf = open('b.txt','w')
s = set()
while True:
line = af.readline()
if not line:
break
tokens = line.split()
for i in xrange(len(tokens)):
if tokens[i].startswith('为'):
key = ' '.join(tokens[i - 1 : i + 2])
if key not in s:
bf.write(line + '\n')
s.add(key)
af.close()
bf.close()
热心网友 时间:2024-10-24 17:31
--简单...不过这点分(20)可不象"冰天雪地跪玻璃渣"给得分...
一会儿等我有空写给你...
#/usr/bin/perl -w