Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

Расстановка ударений в тексте #242

Open
De2mon opened this issue Oct 23, 2024 · 4 comments
Open

Расстановка ударений в тексте #242

De2mon opened this issue Oct 23, 2024 · 4 comments

Comments

@De2mon
Copy link

De2mon commented Oct 23, 2024

Подскажите, пожалуйста, Ваша программа может просто расставить ударения в тексте (плюсами перед ударной гласной, не запуская текст на чтение) в соответствии со всеми словарями RHVoice?
Это позволило бы расширить её область применения, чтобы использовать для других качественных голосовых движков, например, на основе нейросетей.

@vantu5z
Copy link
Owner

vantu5z commented Oct 23, 2024

Нет, она для этого не предназначена.
Она разрабатывается как дополнение к RHVoice. То есть если RHVoice читает что-то неправильно и ударение можно определить однозначно, то такое слово (словосочетание) добавляется просто в словарь, который обрабатывается RHVoice. Если ударение зависит от контекста, то создается правило для выявления данного контекста и модификации текста, чтобы RHVoice прочитал его правильно.

Как преобразуется текст после прогонки через скрипты можно посмотреть примерно так:

    from rhvoice_tools import text_prepare
    new_text = text_prepare(text)

Чисто теоретически можно расставить ударения определенные в наших скриптах и словарях. Но мы охватываем область неправильных ударений, поэтому расстановка по всему тексту не получится. Возможно в RHVoice есть механизм расстановки ударений перед чтением текста, тогда уже можно что-то совместно придумать.

@vantu5z vantu5z changed the title Расстановка ударений к тексте Расстановка ударений в тексте Oct 23, 2024
@De2mon
Copy link
Author

De2mon commented Oct 24, 2024

Вы говорите "Чисто теоретически можно расставить ударения определенные в наших скриптах и словарях." - у меня тоже есть готовые словари омографов для RHVoice - их огромное количество. Так их можно подставить в вашу программу ? Куда их положить?

@De2mon
Copy link
Author

De2mon commented Oct 24, 2024

Есть такая проблема у всех голосовых движков - неправильные ударения. И никто (НИКТО !) её до сих пор не решил. Для RHVoice пользователи создали огромную массу словарей омографов и хотя ошибки все-равно проскакивают, но они уже не так критичны. Есть ли у вас программа способная на основе словарей пользовательских RHVoice (которые у всех есть) расставить к тексте (или в строковой переменной) ударения? RHVoice уже сильно устарел по качеству, но если бы была программа расстановки ударений - её можно было бы применить к любым другим движкам!

@vantu5z
Copy link
Owner

vantu5z commented Oct 25, 2024

Так их можно подставить в вашу программу ? Куда их положить?

  • Если описание ударения укладывается в формат словаря RHVoice, то можно положить в один из словарей в dicts/Russian или положить отдельным файлом.
  • Если не укладывается в формат, то правила расстановки указываются в функции stress_marker_samples() в файле templates.py. Для включения данной функции нужно указать "символ ударения" в настройках, он должен соответствовать символу ударения используемому в настройках RHVoice.

Есть ли у вас программа способная на основе словарей пользовательских RHVoice (которые у всех есть) расставить к тексте (или в строковой переменной) ударения?

Мы себе такую задачу не ставили. Но это не трудно сделать, т.к. формат словаря известен. Также можно порыться в проекте RHVoice, возможно там уже есть "программа" для обработки словаря и расстановки ударений в тексте.

можно было бы применить к любым другим движкам

В части предварительной обработки текста, ее можно уже сейчас использовать с другими движками:

  • вручную, используя функцию text_prepare():
from rhvoice_tools import text_prepare
new_text = text_prepare(text)
<передача обработанного текста движку>
  • модифицировать скрипты запуска rhvoice_say

# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants