LookupError:
**********************************************************************
Resource punkt not found.
Please use the NLTK Downloader to obtain the resource:
>>> import nltk
>>> nltk.download('punkt')
For more information see: https://www.nltk.org/data.html
Attempted to load tokenizers/punkt/english.pickle
Searched in:
- 'C:\\Users\\username/nltk_data'
- 'C:\\Users\\username\\anaconda3\\envs\\conda-env\\nltk_data'
溶液**:手动下载软件包。
第一步**:在http://www.nltk.org/nltk_data/中查找对应的语料库,如本例中为 * Punkt Tokenizer Models *;单击下载并存储在上面提到的文件夹之一(如果nltk_data文件夹不存在,请创建一个)。对我来说,我选择了"C:\Users\username/nltk_data"。
3条答案
按热度按时间0md85ypi1#
我猜下载器脚本坏了。作为临时解决方案,可以从here手动下载punkt tokenizer,然后将解压缩的文件夹放在相应的位置。每个操作系统的默认文件夹是:
C:\nltk_data\tokenizers
/usr/share/nltk_data/tokenizers
我不确定,但您可能会发现这个post很有帮助。
bzzcjhmw2#
虽然这是个老问题,但今天我的mac也遇到了同样的问题,这里的解决方案帮我解决了这个问题。
编辑:
Run the following command on the OSX before running nltk.download():
h9a6wy2h3#
如果
nltk.download()
不适合您,下面是手动安装punkt
的详细说明。nltk.word_tokenize()
,但它抛出错误:nltk_data
文件夹不存在,请创建一个)。对我来说,我选择了"C:\Users\username/nltk_data"。