opencorpora icon indicating copy to clipboard operation
opencorpora copied to clipboard

Неверное кол-во абзацев в списке документов в ner.php

Open victorbocharov opened this issue 8 years ago • 6 comments

http://opencorpora.org/books.php?book_id=734

Это следствие удаления дублей?

victorbocharov avatar Aug 29 '16 12:08 victorbocharov

Возможно. Вообще нумерация без пропусков не гарантирована нигде, эти номера только задают порядок.

grandsbor avatar Aug 29 '16 12:08 grandsbor

В ner это привело к тому, что в некоторых текстах указано больше абзацев, чем есть на самом деле. Видимо, нужно поправить подсчёт абзацев в ner.

victorbocharov avatar Aug 29 '16 13:08 victorbocharov

сс @madfriend

victorbocharov avatar Aug 29 '16 13:08 victorbocharov

@victorbocharov пример есть?

grandsbor avatar Dec 29 '16 16:12 grandsbor

@victorbocharov пример есть? :)

grandsbor avatar Jan 12 '18 20:01 grandsbor

Если что, количество абзацев считается здесь: https://github.com/OpenCorpora/opencorpora/blob/e66a0ebb313d98dbfc5c98b5482da00bf46f2828/lib/lib_ne.php#L79 (экономлю Диме пару минут времени :))

madfriend avatar Jan 15 '18 13:01 madfriend