RHVoice-dictionary icon indicating copy to clipboard operation
RHVoice-dictionary copied to clipboard

Хочу помочь с развитием

Open GFOXSH opened this issue 8 years ago • 40 comments

Буду сюда писать о всех обнаруженных ошибках в произношении.

GFOXSH avatar Jun 14 '16 02:06 GFOXSH

Первый отчет: После войны' - читает как после во'йны В лесу' - читает как в ле'су

GFOXSH avatar Jun 14 '16 03:06 GFOXSH

Странно. Правила для обоих этих случаев есть в словаре. Единственное, что мне приходит в голову: попробуйте переустановить пакет rhvoice-dictionary-git и затем перезапустите RHVoice-service.

capricorn2001 avatar Jun 14 '16 07:06 capricorn2001

Все выяснилось: была установлена не последняя версия R. H. Voice.

GFOXSH avatar Jun 17 '16 06:06 GFOXSH

ма'ло - читает как мало' Но: Гектор Мало'

GFOXSH avatar Jun 17 '16 06:06 GFOXSH

У меня движок читает "мАло" по умолчанию без словаря. Внести правило "Гектор{,а,е,у,ом} Мал+о" оставляю на усмотрение maintainer'а пакета.

capricorn2001 avatar Jun 17 '16 07:06 capricorn2001

@capricorn2001, похоже у Вас установлен словарь с примерами: /etc/RHVoice/dicts/Russian/example.txt и там как раз есть правило:

; Указание ударения непосредственно в слове.
м+ало

Добавил писателя Мало commit 08a6592

@GFOXSH , спасибо за участие! Скажите для информации на какой OS используете RHvoice и какие словари подключены, кроме данного.

vantu5z avatar Jun 17 '16 10:06 vantu5z

Тестирую на Android OS. Словарь установлен только Ваш.

GFOXSH avatar Jun 17 '16 11:06 GFOXSH

Добавил правило м+ало - произносит верно. Может, создадите отдельный словарь для Android?

GFOXSH avatar Jun 17 '16 11:06 GFOXSH

О, Андроид. Не могли бы вы рассказать куда необходимо положить словарь и возможно какие дополнительные манипуляции нужно проделать, чтобы установить словарь? И я добавлю эту информацию в readme.

vantu5z avatar Jun 17 '16 11:06 vantu5z

Пожалуйста: нужно в папке /sdcard/Android/data/com.github.olga_yakovleva.rhvoice.android/files создать папку dicts, а в ней - Russian, а в нее скинуть словарь. Но желательно использовать эту версию голоса, т.к. оригинальная версия не поддерживает любой словарь из-за бага: RHVoice.zip

GFOXSH avatar Jun 17 '16 11:06 GFOXSH

стреко'за а не стрекоза' заме'р а не за'мер (но это уже омограф).

GFOXSH avatar Jun 17 '16 12:06 GFOXSH

@vantu5z, совершенно верно - example.txt я оставил. @vantu5z, @GFOXSH, слово "стрекоза" у меня читается правильно.

capricorn2001 avatar Jun 17 '16 13:06 capricorn2001

@capricorn2001 а если в родительном? "стрекозы"?

GFOXSH avatar Jun 17 '16 13:06 GFOXSH

@GFOXSH, мы не можем разделить родительный падеж единственного числа и именительный множественного. Приходится выбирать что-то одно.

capricorn2001 avatar Jun 17 '16 14:06 capricorn2001

@GFOXSH, добавил правила: *{е,о}й стрекоз+ы у стрекоз+ы Это исправит часть случаев.

capricorn2001 avatar Jun 18 '16 07:06 capricorn2001

@capricorn2001 стрекоз{е,у,ой}/-1 Лично у меня R. H. Voice все читает неправильно, кроме именитльного единственного и множественного.

GFOXSH avatar Jun 18 '16 07:06 GFOXSH

Или вот такое правило: {за,об,по}мер/1 Ибо вместо за'мер, читает заме'р (что, правда, хорошо для технических текстов).

GFOXSH avatar Jun 18 '16 07:06 GFOXSH

Кроме того неплохо было бы вынести имена и фамилии в отдельный файл, т.к. для каждого текста являются индивиддуальными и, таким образом, пользователь мог бы с легкостью добавлять в лексикон новые слова, без необходимости перерабатывать весь документ. Пишу это, потому что редактирую словарь на Android и зачастую не хватает ОЗУ, чтобы загрузить большой файл в редактор. Но это уже на Ваше усмотрение.

GFOXSH avatar Jun 18 '16 07:06 GFOXSH

Относительно отдельного файла для имен и фамилий, думаю, Вы правы. Последнее слово тут за maintainer'ом. Добавляю шаблон "стрекоз+{е,ой}". Вариант "стрекозУ" у меня читает правильно.

capricorn2001 avatar Jun 18 '16 09:06 capricorn2001

Совершенно верно, есть существительное "замЕр", "обмЕр" тоже есть. Вопрос, достаточно ли часто они встречаются. Оставлю на усмотрение vantu5z'а. В слове "пОмер" у меня ставит ударение правильно.

capricorn2001 avatar Jun 18 '16 10:06 capricorn2001

@capricorn2001 верно, на счет помер - моя ошибка.

GFOXSH avatar Jun 18 '16 11:06 GFOXSH

Да у вас тут работа прям кипит! Извините, я на даче и не смогу ввязаться в вашу бурную дискуссию :) Но пару слов скажу, раз меня упоминали. Поддерживаю вынос имён в отдельный файл (я буквально пару дней назад об этом подумал). По поводу замера - думаю "зАмер" встречается чаще в художественных текстах и можно внести его производные в словарь. Стрекозу обработали, молодцы! ^_^

vantu5z avatar Jun 18 '16 15:06 vantu5z

А вот я ещё и пчелу с осой обработаю сейчас :)

capricorn2001 avatar Jun 18 '16 16:06 capricorn2001

По-моему было бы неплохо добавить в словарь и слово м+ало, для тех у кого нет стандартного exaplpe.txt Интересно, можно ли исправить усиленное ударение на последнее слово "не с кем"? Например, внеся правило н+е с кем ?

GFOXSH avatar Jun 19 '16 03:06 GFOXSH

Или вот: ...город только начАл просыпаться... Предлагаю правило: Н+ачал*

GFOXSH avatar Jun 19 '16 03:06 GFOXSH

Вот еще кое-что - ачередной омограф: ПосмОтрите - ПосморИте Я даже не знаю, как его сучше реализовать... {по,при}смотр+ите* ? Но тогда будет теряться ПосмОтрите в значении "вот увидите"...

GFOXSH avatar Jun 19 '16 05:06 GFOXSH

Добавил шаблоны не/1 о {ко,че}м/u не/1 с {к,ч}ем/u Правило н+ачал* не годится: будет неправильно читать существительное начало, и глагол началось (ударение на о).

capricorn2001 avatar Jun 19 '16 07:06 capricorn2001

@capricorn2001 а если так: н+ачал{,а,и} ?

GFOXSH avatar Jun 19 '16 07:06 GFOXSH

Если maintainer не против, добавлю правило н+ачал{,и}. В слове начала ударение ставится либо на последний, либо на предпоследний слог.

capricorn2001 avatar Jun 19 '16 08:06 capricorn2001

Поправка. У меня слово начали читает правильно - ударение на первом слоге. Правило сокращается до н+ачал.

capricorn2001 avatar Jun 19 '16 08:06 capricorn2001

@capricorn2001 верно, извините. Перепроверил все - действительно так.

GFOXSH avatar Jun 19 '16 08:06 GFOXSH

Варианты ударения в словах {по,при}смотрите, а также стОит или стоИт и многие другие можно выбирать правильно только в контексте. В словаре, к сожалению, можно только указать наиболее часто встречающийся вариант. Добавляю: з+амер н+ачал

capricorn2001 avatar Jun 19 '16 11:06 capricorn2001

Добрый день! Тут у меня мысль по поводу словаря имен... На Ваше усмотрение хочу предложить следующее - поделить словарь примерно на ; Английские имена ... ; Немецкие имена ... ; Русские имена ... ; Французские имена ... ; Японские имена ... и так далее, на возможно большее число стран. Слушателю, в девайсе которого недостаточно ОЗУ всего лишь надо удалить блоки имён, которые заведомо не встречаются в книге.

GFOXSH avatar Jun 22 '16 02:06 GFOXSH

@GFOXSH, думаю пока идея не актуальна, т.к. имен в словаре не так уж и много. В зависимости, как будет пополняться данный раздел и примем решение, как его делить/сортировать и т.д.

vantu5z avatar Jun 22 '16 05:06 vantu5z

@vantu5z, у R.H. Voice с именами совсем туго. После 5-минутного (!) пробега я внес в словарь не меньше 20 слов. Сейчас все перепроверю и поделюсь первыми наработками. Принцип действия у меня, правда, не "научный" - в текстовый документ вписываю имена первых приходящих в голову литературных героев, а затем слушаю и исправляю. Просто... Мне немного стыдно за безсистемность...

GFOXSH avatar Jun 22 '16 08:06 GFOXSH

Итак, за время моего отсутсвия я вспомнил 222 имени и фамилии и сделал 69 правок. Боже, "сейчас" растянулось на 3 часа... Извините, пожалуйста, что заставил столько ждать. Видимо я слегка заработался над этим словарем...

GFOXSH avatar Jun 22 '16 11:06 GFOXSH

Кое-что в нем исправил:

Акоп{а,е,у,ам,ами,ов,ом,ы}/2 Арн(е=э)/2 Барми/1 Барни/1 Басс(е=э)т{,а,е,у,ам,ами,ов,ом,ы}/1 Боун{,а,е,у,ам,ами,ов,ом,ы}/1 (Ва=Уо)тсон{,а,е,у,ам,ами,ов,ом,ы}/2 В(е=э)нс{,а,е,у,ам,ами,ов,ом,ы}/1 Виалпандо/3 Вуст(е=э)р{,а,е,у,ам,ами,ов,ом,ы}/1 Гаппи/1 Гарольд{,а,е,у,ам,ами,ов,ом,ы}/1 Гр(е=э)гсон{,а,е,у,ам,ами,ов,ом,ы}/1 Грицацуев{,а,е,у,ам,ами,ов,ой,ом,ы}/3 Гасси/1 Д(е=э)низ/1 Дж(е=э)тро/1 Джиззи/1 Джудит/1 Дз(е=э)ниб{а,ам,ами,е,у}/2 Дэли{ей,и,ю,я,ям,ями}/1 З(е=э)ро Кадор{,а,е,у,ам,ами,ов,ом,ы}/2 Калхаун{,а,е,у,ам,ами,ов,ом,ы}/2 Кляйнер{,а,е,у,ам,ами,ов,ом,ы}/1 Кобаяси/3 Колон(е=э)л/3 Комази/3 Кохакунуси/4 Кр(е=э)й{,а,е,у,ам,ами,ов,ом,ы}/1 Крист(е=э)фал{е,ем,ь,ю,я}/3 Лав(е=э)рн(е=э)/2 Латор(е=э)/2 Лео/1 Леон(е=э)/2 Луиджи/2 Магнуссон{,а,е,у,ам,ами,ов,ом,ы}/1 Максв(е=э)лл{,а,е,у,ам,ами,ов,ом,ы}/1 М(е=э)лвин{,а,е,у,ам,ами,ов,ом,ы}/1 М(е=э)нд(е=э)з{,а,е,у,ам,ами,ов,ом,ы}/2 Мо(сс=с)ман{,а,е,у,ам,ами,ов,ом,ы}/1 Никихаями/4 Огастас{а,е,у,ам,ами,ов,ом,ы}/2 Огино/2 О-Джи=(Оу Джи)/1 Оутс{,а,е,у,ам,ами,ов,ом,ы}/1 Оуэн{,а,е,у,ам,ами,ов,ом,ы}/1 Пастрано/2 Пуласки/2 Райд(е=э)р{,а,е,у,ам,ами,ов,ом,ы}/1 Род(е=э)рик{,а,е,у,ам,ами,ов,ом,ы}/1 Роз(е=э)нберг{,а,е,у,ам,ами,ов,ом,ы}/3 Рози/1 Светорад{а,ам,ами,е,ой,у}/3 Споуд{,а,е,у,ам,ами,ов,ом,ы}/1 Ст(е=э)фани/1 Ст(е=э)фано/2 Сти(фф=ф)и/1 Тихиро/3 Тони/1 Тор(е=э)но/2 Трэв(е=э)рс{,а,е,у,ам,ами,ов,ом,ы}/1 Уоткин{,а,е,у,ам,ами,ов,ом,ы}/2 Флор(е=э)нс{,а,е,у,ам,ами,ов,ом,ы}/1 Фрим(е=э)н{,а,е,у,ам,ами,ов,ом,ы}/1 Хаякав{а,ам,ами,е,ой,у}/3 Ш(е=э)пард{,а,е,у,ам,ами,ов,ом,ы}/1 Шт{е=э}нварт{,а,е,у,ам,ами,ов,ом,ы}/1 Эрнанд(е=э)с{,а,е,у,ам,ами,ов,ом,ы}/2

GFOXSH avatar Jun 22 '16 17:06 GFOXSH

Ничего себе списочек :) Насчет системности, у меня ее еще меньше. Rhvoice периодически читает новости, цитаты и если успел услышать неправильное произношение, то смотрю как лучше добавить. По времени мы тоже никуда не торопимся, сроков нет))) так что, есть время и желание попилил немного и уже хорошо. Главное получать удовольствие от этого. Завтра постараюсь добавить твой списочек в словарь, есть время подправить недочеты ;)

upd: добавил ваш списочек - commit 5e04b7f

vantu5z avatar Jun 22 '16 17:06 vantu5z

Могу предложить свои исправления: Сначала написал сюда, затем Сделал свой форк, потому что очень часто обновлял. Имена и фамилии Из повседневной жизни, из социальных сетей и прочее. И друзьям буду с их исправленными фамилиями свой форк ставить.

alekssamos avatar Nov 12 '20 14:11 alekssamos

Спасибо за участие в пополнении. действительно много фамилий додавлено и много другого. Как закончите, создавайте PR и додавим Ваши изменения.

Не понял назначение roman_digits_dict.txt с Римскими цифрами?

Пока смотрел изменения возник вопрос: слова добавляются из-за неправильного чтения?

vantu5z avatar Nov 17 '20 15:11 vantu5z