Glas 2004 is а formant Bulgarian Text To Speech Synthesizer, created by Todor Arnaudov in 2004.
Projects for future versions Glas 2 and Glas 3 are mentioned.
Projects for future versions Glas 2 and Glas 3 are mentioned.
Глас е синтезатор на реч ("говореща програма"), който разработвах експресно през април 2004 г.
Много ми вървеше работата по онова време, имах и много идеи за подобрения, но страстта ми се поизчерпа и ме затрупаха други грижи.
Twenkid FX - Софтуер за монтаж, композитинг и ефекти
Гледай филма
Twenkid Research - Todor Arnaudov's Researches
Сега съм се наел да направя "Глас 2" като магистърска дипломна работа. Изглеждаше най-реалистично да стане между другото (между 8 ч работен ден и разпиляването по други работи ). Останалите проекти и идеи са прекалено тежки за да стане от тях нещо достатъчно солидно сега.
Гледай филма
Twenkid Research - Todor Arnaudov's Researches
Сега съм се наел да направя "Глас 2" като магистърска дипломна работа. Изглеждаше най-реалистично да стане между другото (между 8 ч работен ден и разпиляването по други работи ). Останалите проекти и идеи са прекалено тежки за да стане от тях нещо достатъчно солидно сега.
Глас 2004 (172 KB)
Статии за Глас от 2004 г или Тук
Деактивирано сваляне!
Очаквайте "Тошко 2"!
Речник на юнашкото наречие, който ползва Глас
Езикотворец 8 или Тук или Там (203 KB)
Ctrl+G - Изговаря текста. Ако е маркирано нещо - маркираното, иначе - всичко в прозорецаСтатии за Глас от 2004 г или Тук
Деактивирано сваляне!
Очаквайте "Тошко 2"!
Речник на юнашкото наречие, който ползва Глас
Езикотворец 8 или Тук или Там (203 KB)
Ctrl+H - Прекъсва изговора, след края на изказа.
Настройки - скорост на изговора, тембър и дължина на прехода между тонални звуци. Можете да си поиграете, за да намерите приемлива скорост.
Изказ - един "дъх", който не може да се прекъсне. Стойността по подразбиране е на петия ред в конфигурационния файл "osnova_glas.txt" (виж по-долу)
Други - настройка на скоростта на изговора чрез броя периоди на гласните и тоналните съгласни.
osnova_glas.txt
0 1
1 paket.dll
0
0 paket.dll
60 //дължина на изказа по подразбиране
-1
-0.03
0 0.5
25000 3000000
vhod.dll
fonemi0.txt
1 leleta.dll
1 kusidulgi.dll
1 slivane.dll
1 bezzvuk.dll
1 nizove.dll
0 0.7
0
2
ръчно ruchno.txt ruch.dll 0 1
слово text.txt _z.dll 1 1
...
Въпроси и отговори
В: Какво вършат останалите настройки?
- Тайна! :-P
В: Защо интерфейсът е толкова дървен? Защо няма плъзгачи за скорост, тембър и т.н., а се задават от меню?
Защото интерфейсът е под Win32 и е програмиран на ръка без никакви графични помощници за ресурси. В Езикотворец има настройки на параметрите на Глас с плъзгачи.
В: В "Помощ" пише, че "не е съвсем безплатен?"
Не се безпокой, безплатен е... :)
В: Има проблеми с пействането от някои места?!
Вероятно да. Тази версия работи с ANSI (Windows-1251), и ако пействаш от уникод (UTF-8 или UNICODE), текстът няма да може да се изговори.
В: Системни изисквания?
Предполагам Windows 95 и съвместими с него. :) Писан е под Win 98, Pentium 200 MMX, 64 МB RAM, и под Win XP работи дори по-добре. Програмата използва няколко МБ оперативна памет. Магическото число 3000000 от конфиг. файл задава максималния размер на буфера за звук. ;)
Общи характеристики на "Глас" 07.05.2004:
- Хибриден микрофонемен/формантен синтезатор (с изключение на шумовите съгласни)
- Променлива скорост чрез промяна на продължителността на гласните и звучните съгласни.
- Плавни преходи между съседни гласни/звучни съгласни, звучащо като извиване на гласа.
- Променлив тембър чрез променлива честота на гласните и звучните съгласни.
Първична обработка на текста:
- Замяна на едни низове с други (експериментално изпълнение; засега само 0->нула, 1->едно, 2->две, 3->три...; г. - година, т.е. - тоест)
- Различаване на меко и твърдо "л" ("леле" => "л2ел2е"; България => България)
- Различаване на "къси" и "дълги" съгласни в краищата на думи.
- Обеззвучаване на звучни съгласни.
* Специални възможности:
- Ударени и редуцирани гласни (при ръчно описание, не ги разпознава автоматично)
...
Глас 2 и Глас 3
Имам много идеи, но не знам доколко ще се занимавам точно с тях. Ще видим.
В Глас 2 се очаква да има:
- ударения - автоматично разпознаване на ударенията чрез модул на доц. Христо Крушков (но не знам дали ще мога да разпространявам свободно версия с такива възможности)
- интонация;
- евентуално по-голям контрол върху тембъра и темброви контури
- пеене
- по-сложен модел на генериране на звука (по-човешко звучене)
- може би звуци за емоции
В Глас 3 (...)
Тайна!
Очаквайте синтезатора "Тошко 2"!
и "Тошко 3" - тогава ще видите какво ще може.
0 коментара:
Post a Comment