站点介绍
站点方面是一个开源项目,内容方面都是一些文档或者文本,如果你是一个需要学习英文的朋友,那么你可以考虑关注这个项目,理论上可以帮助到你不少。
项目首页截图如下:
通过项目界面我可以清楚的看到项目包含的内容,继续往下看,可以看到作者对于该项目所有的文件相关介绍,以及这些数据都是来自哪里,具体的可以看看下面的介绍内容:
1)大学英语四级词汇表内容提取自 http://fl.gzu.edu.cn/picture/article/283/f0/82/a954664a435bb359db15807a4d56/ad9d197b-48a8-486c-9be0-bd73e78d2b64.pdf ,此PDF内嵌入Kingsoft Phonetic Plain字体用于显示音标,导致转换为TXT时音标部分为乱码,故全部予以替换。替换过程中可能会出现失误,原始文档本身也有错误,我通读了一遍一一校正,或许依然有讹误存在,待日后完善。
2)大学英语四、六级词汇表(CET4+6_edited)整理自“全国大学英语四、六级考试大纲》2016年版"( http://www.cet.edu.cn/file_2016_1.pdf )。
3)台灣高中英文參考詞彙表 下载自 https://sites.google.com/a/ms2.cdjh.hc.edu.tw/english2012/03ke-cheng-gui-hua/7000dan-zi
4)托福、GRE词汇表来自我个人保存的资料,源于2003年版金山词霸。其中GRE表收录了不少生僻艰难单词(近8000),似乎与改革后降低词汇要求的考试精神不符,不过就我本人而言,它正是这份词汇表的价值所在。另附其他GRE词汇表供参考。
5)COCA 20000词频表搜集自网络,同时利用爬虫程序提取了简明汉语释义供参酌。
6)TOEFL_abridged 收录删除所有四六级词汇后的托福单词。
7)GRE_abridged 收录删除所有四六级、托福词汇后的GRE单词。
8)COCA_abridged 收录COCA 20000删除四六级、托福、GRE词汇后的单词,且逐条阅读,删除明显由原形动词的动名词、过去分词形式构成的衍生词,以及部分形容词+ly组成的副词等。
9)OALD8_abridged_edited 收录牛津高阶英汉双解词典(第8版)删除四六级、托福、GRE、COCA_abridged词汇后的单词。且通读,删除短语,删除缩略语,删除无中文释义的异体词,删除“-”开头或结尾的词缀。
项目最后一次更新是两年之前,数据方面可能就只能仅供参考的,部分内容随着时间推移会有些许变化,但是不可能变动很大,大家根据自己的需求来进行选择。
额外补充
此类项目如果想要时刻维护,成本是极高的,因为涉及到的数据太多了,所有数据都需要维护的话,排除事件成本,个人精力成本也不可小觑。
如果你觉得有更好的开源项目,欢迎留言反馈,如果你想要好好学习英语,本站点也提供了不少可以学习英语的站点,有需要的可以搜索一下“英语”。