如何解决 类似 nltk安装Wordnet出错[nltk

如何解决 类似 nltk安装Wordnet出错[nltk,第1张

参考:https://blog.csdn.net/liu16659/article/details/109691534

最近想做一个NLP的数据增强,于是找到了
EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks
代码地址
https://github.com/jasonwei20/eda_nlp
但是,需要nltk库,我直接

pip install -U nltk

然后按照其方式运行

python code/augment.py --input=<insert input filename>

发现出现了错误,提示我要安装wordnet包

import nltk
nltk.download('wordnet')

但是,出现了如下错误:
nltk安装Wordnet出错[nltk_data] Error loading wordnet: <urlopen error [Errno 111]
我尝试了很多方法,最终得到了如下结论:
1.首先去官网下载对应的包
http://www.nltk.org/nltk_data/

2.然后去github下载 nltk_data文件
https://github.com/nltk/nltk_data
这里下载好之后要改文件名为 nltk_data

3.把nltk_data放入对应的文件夹中,我是直接放在了
/home/你的用户名/nltk_data
我是linux下的anaconda环境,不知道放在anaconda的环境里面行不行

4.在nltk_data文件中创建corpora文件,并且将步骤1中下载的包(这里一定要是.zip形式的,比如把wordnex.zip放入corpora文件中)放入corpora文件。

5.再次尝试

python code/augment.py --input=<insert input filename>

发现解决了问题。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/langs/717167.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-04-25
下一篇2022-04-25

发表评论

登录后才能评论

评论列表(0条)

    保存