nlp工具spacy库的使用
初见spacy
由于使用stanfordcorenlp时一直报错,不得已改用spacy
关于spacy及其安装
Spacy 是由 cython
编写。因此它是一个非常快的库。 spaCy
提供简洁的接口用来访问其方法和属性 governed by trained machine (and deep) learning models.
spacy安装
pycharm下直接安装即可,其他方式也可用命令行
pip install spacy
第一次用python的小伙伴pip速度慢建议搜一下更换pip国内源 pip更换源教程
下载模型
由于大部分小伙伴主要还是做中文处理,所以还要安装中文的模型
python -m spacy download zh_core_web_sm
但直接按上述方式下载由于不可抗力会报错,需要科学上网,如果打开了科学上网还不行的同学应该是没有配置命令行的代理,按下面的步骤在命令行下执行(10809是科学上网的端口号,win10搜索代理进入相关设置观看)
set HTTP_PROXY=http://127.0.0.1:10809
set HTTPS_PROXY=http://127.0.0.1:10809
spacy初使用
import spacy
nlp = spacy.load("zh_core_web_sm")
doc = nlp(u'不管下雨又刮风,泥巴路上花一朵')
for token in doc:
print(token)
for token in doc:
print(token, token.pos_, token.pos)
结果