如何从文件中读取文本并检查重复的单词

嗨伙计们,
我有一个文本文件,我试图从该文件中读取文本,然后检查每个单词周围有40个单词,以确保有问题的单词没有重复超过一次。
换句话说,我想首先将文本拆分成单词,将它们放在一个列表中,然后对照[1]检查[0],直到[39]。然后我想对照[40]检查[1],然后对照[41]检查[2],依此类推。
我觉得拆分单词并不难,我只需要在每个空格和每个点上拆分即可。我不知道该怎么做,就是把这些词和课文中的其他词核对一下。
伙计们,你们有什么办法吗?

# 回答1


Count函数应该可以工作。如果COUNT>1,则重复该单词。
导入字符串
String.count("您要检查的单词",开始、结束)
我相信您可以使用循环和字符串索引来定义开始和结束。
(但所有这些都可能完全是胡说八道,我对Python还是个新手。对不起,如果我把你引入歧途了……)
# 回答2


您希望将文本拆分成单词列表(全部小写),对单词列表进行排序,并将This_Word与Next_Word进行比较。更简单的方法是转换为集合,因为集合不允许重复关键点,然后检查集合的长度与原始列表的长度相比。您也可以使用词典,以单词为关键字,指向一个整数,该整数用于计算单词出现的次数。

标签: python

添加新评论