opencorpora
opencorpora copied to clipboard
Неверное кол-во абзацев в списке документов в ner.php
http://opencorpora.org/books.php?book_id=734
Это следствие удаления дублей?
Возможно. Вообще нумерация без пропусков не гарантирована нигде, эти номера только задают порядок.
В ner это привело к тому, что в некоторых текстах указано больше абзацев, чем есть на самом деле. Видимо, нужно поправить подсчёт абзацев в ner.
сс @madfriend
@victorbocharov пример есть?
@victorbocharov пример есть? :)
Если что, количество абзацев считается здесь: https://github.com/OpenCorpora/opencorpora/blob/e66a0ebb313d98dbfc5c98b5482da00bf46f2828/lib/lib_ne.php#L79 (экономлю Диме пару минут времени :))