razdel
razdel copied to clipboard
Правильное разбиение числовых диапазонов
Здравствуйте.
Токенизатор правильно разбивает тексты, где содержатся названия городов:
Ростов-на-Дону Санкт-Петербург
Однако с диапазонами значений он поступает аналогично:
2016-2017
- один токен
5-кратное
- один токен
10ти-кратное
- разбивается на 10
и ти-кратное
2016-2017 - один токен
Спасибо, надо будет поправить
5-кратное - один токен
Это не ошибка, так? "5-кратное" должен оставаться одним токеном?
Насчет 5-кратное
согласен с вами, так должно остаться. Слово пятикратное
пишется слитно.
По правилам "10ти-кратное" - тоже неверное написание. Должно быть "10-кратное".
Цитатат из http://new.gramota.ru/spravka/letters/87-rubric-99 :
При использовании словесно-цифровой формы записи буквенные наращения после числительных не пишутся.