使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

KET的单词量接近2000个,我想知道哪些单词是真正考试中会高频出现的。所以产生了一个想法,通过Python进行分析一下词频,然后导出单词表,也方便导入到背单词软件里面。

1,找到一本真题书

我找到一个PDF版本,但是是影印版本,里面的文字不能直接复制。

使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

2,通过OCR复制出里面的文本内容

我用的是ABBYY Fine Reader ,网上搜一下,许多免费版

把头和尾去掉,剩下正题部分,保存到txt 文件里面

使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

3,把KET2000个单词表保存出来,和里面的单词进行匹配

也保存为txt 

使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

4, 编写python 。直接问 文心一言生成一个 

提示词

我想用python 写一个 英语试卷 词频分析软件

1, 导入 source.txt

2, 去除所有数字和单个字母,去除非英语单词,也就是只保留下英语单词,然后把单词全部转换为小写。

3, 用我的英语单词书进行匹配,不匹配的去除掉。 

3, 按照出现的频率进行排序 ,

4, 按高频到低频输出到result.txt 格式是  <单词 > <出现次数>

使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

5,把source.txt English_word.txt ,还有python文件放一个目录,执行python

使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

复制到excel或者单词书

使用Python分析英语试卷中出现的单词频率,找出KET真题考试高频词

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容