spacy-ru icon indicating copy to clipboard operation
spacy-ru copied to clipboard

Как включить noun_chunks? Возможно ли это с данной моделью?

Open realsergii opened this issue 5 years ago • 8 comments

https://spacy.io/api/doc#noun_chunks

realsergii avatar Mar 03 '19 18:03 realsergii

Существительные POS-модель выделяет, так что по идее должно работать.

buriy avatar Mar 03 '19 19:03 buriy

не работает

realsergii avatar Mar 04 '19 09:03 realsergii

ну, как в анекдоте, тогда ой...

buriy avatar Mar 04 '19 18:03 buriy

Привет! Интересно, были какие-нибудь ли изменения. На всякий опишу чуть подробнее проблему в моём случае. В Гугл колабе:

!pip install pymorphy2 spacy==2.1.9 git+https://github.com/buriy/[email protected]
!git clone -b v2.1 https://github.com/buriy/spacy-ru.git`

import ru2

nlp = ru2.load_ru2('/content/spacy-ru/ru2')
doc = nlp('джон кеннеди и никита хрущев, в отличие от фиделя кастро, действительно не намного пережили события карибского кризиса.')

for chunk in doc.noun_chunks:
    print(chunk.text)

Получаю:

ValueError: [E029] noun_chunks requires the dependency parse, which requires a statistical model to be installed and loaded. For more info, see the documentation: https://spacy.io/usage/models

Сначала думал, что установил неправильно, но дело, я так понимаю, не в этом.

ysapolovych avatar Jul 10 '20 14:07 ysapolovych

Привет, dependency parse там делается, и ru2 вроде бы умеет noun_chunks. Я сейчас готовлю релиз для версии 2.3 , и там специально займусь проблемой с noun_chunks.

buriy avatar Jul 10 '20 14:07 buriy

Столкнулся с похожей проблемой: doc = proc("Где я могу заказать пропуск на машину?") [(chunk.text, chunk.root.text, chunk.root.dep_, chunk.root.head.text) for chunk in doc.noun_chunks]

на вывод пустой список []

tyomik-mnemonic avatar Dec 23 '20 14:12 tyomik-mnemonic

Скоро починю. Если сделать только версию для 2.3 , то норм?

buriy avatar Dec 23 '20 15:12 buriy

Нам норм , мы с этим релизом планируем работать, будет супер

tyomik-mnemonic avatar Dec 23 '20 16:12 tyomik-mnemonic