Tuesday, May 6, 2008

// // Leave a Comment

Глас 2004 - синтезатор на българска реч | Glas 2004 - Bulgarian Text To Speech Synthesizer

Glas 2004 is а formant Bulgarian Text To Speech Synthesizer, created by Todor Arnaudov in 2004.
Projects for future versions Glas 2 and Glas 3 are mentioned.

Глас е синтезатор на реч ("говореща програма"), който разработвах експресно през април 2004 г.
Много ми вървеше работата по онова време, имах и много идеи за подобрения, но страстта ми се поизчерпа и ме затрупаха други грижи.

Twenkid FX - Софтуер за монтаж, композитинг и ефекти



Гледай филма
Twenkid Research - Todor Arnaudov's Researches




Сега съм се наел да направя "Глас 2" като магистърска дипломна работа. Изглеждаше най-реалистично да стане между другото (между 8 ч работен ден и разпиляването по други работи ). Останалите проекти и идеи са прекалено тежки за да стане от тях нещо достатъчно солидно сега.

Глас 2004 (172 KB)

Статии за Глас от 2004 г или Тук

Деактивирано сваляне!

Очаквайте "Тошко 2"!


Речник на юнашкото наречие, който ползва Глас
Езикотворец 8 или Тук или Там (203 KB)





Ctrl+G - Изговаря текста. Ако е маркирано нещо - маркираното, иначе - всичко в прозореца

Ctrl+H - Прекъсва изговора, след края на изказа.

Настройки - скорост на изговора, тембър и дължина на прехода между тонални звуци. Можете да си поиграете, за да намерите приемлива скорост.

Изказ - един "дъх", който не може да се прекъсне. Стойността по подразбиране е на петия ред в конфигурационния файл "osnova_glas.txt" (виж по-долу)

Други - настройка на скоростта на изговора чрез броя периоди на гласните и тоналните съгласни.



osnova_glas.txt

0 1
1 paket.dll
0
0 paket.dll
60 //дължина на изказа по подразбиране
-1
-0.03
0 0.5
25000 3000000
vhod.dll
fonemi0.txt
1 leleta.dll
1 kusidulgi.dll
1 slivane.dll
1 bezzvuk.dll
1 nizove.dll
0 0.7
0
2
ръчно ruchno.txt ruch.dll 0 1
слово text.txt _z.dll 1 1

...

Въпроси и отговори

В: Какво вършат останалите настройки?


- Тайна! :-P

В: Защо интерфейсът е толкова дървен? Защо няма плъзгачи за скорост, тембър и т.н., а се задават от меню?

Защото интерфейсът е под Win32 и е програмиран на ръка без никакви графични помощници за ресурси. В Езикотворец има настройки на параметрите на Глас с плъзгачи.

В: В "Помощ" пише, че "не е съвсем безплатен?"


Не се безпокой, безплатен е... :)

В: Има проблеми с пействането от някои места?!
Вероятно да. Тази версия работи с ANSI (Windows-1251), и ако пействаш от уникод (UTF-8 или UNICODE), текстът няма да може да се изговори.

В: Системни изисквания?
Предполагам Windows 95 и съвместими с него. :) Писан е под Win 98, Pentium 200 MMX, 64 МB RAM, и под Win XP работи дори по-добре. Програмата използва няколко МБ оперативна памет. Магическото число 3000000 от конфиг. файл задава максималния размер на буфера за звук. ;)



Общи характеристики на "Глас" 07.05.2004:

- Хибриден микрофонемен/формантен синтезатор (с изключение на шумовите съгласни)
- Променлива скорост чрез промяна на продължителността на гласните и звучните съгласни.
- Плавни преходи между съседни гласни/звучни съгласни, звучащо като извиване на гласа.
- Променлив тембър чрез променлива честота на гласните и звучните съгласни.

Първична обработка на текста:
- Замяна на едни низове с други (експериментално изпълнение; засега само 0->нула, 1->едно, 2->две, 3->три...; г. - година, т.е. - тоест)
- Различаване на меко и твърдо "л" ("леле" => "л2ел2е"; България => България)
- Различаване на "къси" и "дълги" съгласни в краищата на думи.
- Обеззвучаване на звучни съгласни.

* Специални възможности:
- Ударени и редуцирани гласни (при ръчно описание, не ги разпознава автоматично)

...


Глас 2 и Глас 3

Имам много идеи, но не знам доколко ще се занимавам точно с тях. Ще видим.

В Глас 2 се очаква да има:

- ударения - автоматично разпознаване на ударенията чрез модул на доц. Христо Крушков (но не знам дали ще мога да разпространявам свободно версия с такива възможности)
- интонация;
- евентуално по-голям контрол върху тембъра и темброви контури
- пеене
- по-сложен модел на генериране на звука (по-човешко звучене)
- може би звуци за емоции

В Глас 3 (...)

Тайна!

Очаквайте синтезатора "Тошко 2"!

и "Тошко 3" - тогава ще видите какво ще може.

0 коментара: