KET的单词量接近2000个,我想知道哪些单词是真正考试中会高频出现的。所以产生了一个想法,通过Python进行分析一下词频,然后导出单词表,也方便导入到背单词软件里面。
1,找到一本真题书
我找到一个PDF版本,但是是影印版本,里面的文字不能直接复制。

2,通过OCR复制出里面的文本内容
我用的是ABBYY Fine Reader ,网上搜一下,许多免费版
把头和尾去掉,剩下正题部分,保存到txt 文件里面

3,把KET2000个单词表保存出来,和里面的单词进行匹配
也保存为txt

4, 编写python 。直接问 文心一言生成一个
提示词
我想用python 写一个 英语试卷 词频分析软件
1, 导入 source.txt
2, 去除所有数字和单个字母,去除非英语单词,也就是只保留下英语单词,然后把单词全部转换为小写。
3, 用我的英语单词书进行匹配,不匹配的去除掉。
3, 按照出现的频率进行排序 ,
4, 按高频到低频输出到result.txt 格式是 <单词 > <出现次数>

5,把source.txt English_word.txt ,还有python文件放一个目录,执行python


复制到excel或者单词书

© 版权声明
文章版权归作者所有,未经允许请勿转载。如内容涉嫌侵权,请在本页底部进入<联系我们>进行举报投诉!
THE END




















暂无评论内容