Sunday, August 10, 2008

Smarty – Extendable Framework for Bilingual and Multilingual Comprehension Assistants | Смарти - разширяема архитектура за интелигентни речници

English - see below


Смарти - разширяема архитектура за интелигентни речници



( Английско-български интелигентен речник )

Версия Алфа 0.1 НБ




Системни изисквания: Windows XP, .NET 1.1 или 2.0

Изтегли: Smarty 0.1 NB

Zip archive(21 MB)
RAR self-extracting exe(16 MB)


Интересно

- Settings -> Search Endings (търси по суфикси) , напр.:

- Търси и предлага възможни изрази - щракни върху "Expressions". След това ляв бутон върху някоя дума, и в балончето ще излезе възможен израз, а в някои случаи - точният израз. По подразбиране е включено "definition".

Въпроси и отговори

1. Алфа 0.1 НБ?

Алфа - около 3 месеца сериозна работа + дребни доработки, направих системата на една специализация в Улвърхямпън. НБ значи "Няма Балканет". Балканет е речников ресурс, който в съчетание с един друг ресурс - WordNet - позволява понякога да се показва точния смисъл на многозначни думи. Уви, BalkaNet не може да се разпространява безплатно.

2. Бавно зарежда?

Да, трябва да се оправи.


3. Ау, искам по-добър вид на тоя прозорец в средата!

И аз, някой ден ще го оправя.

4. Какви са тия табове Disambiguated-Misambiguated?

Щракай и ще видиш. Повече - в следващи версии.

5. Интелигентен речник? Какво му е интелигентното?! Супер тъп е!

Виж презентациите...

---
It's an Alpha version, consumes a lot of memory, a lot of the interface and the internals need re-engineered.

I need few fellows to do good refactoring and reengineering, some research and improvements of the word-sense disambiguation... access to corpora and web... Some 3-6-9 months work... And I believe "Smarty" might become a really useful tool. :)

But at the moment I can't spend a lot of time for it...


...

Любопитно

Задачата ми беше за 3 месеца сам да създам нещо по-добро от една система на XEROX или от един речник на една друга фирма, Morphologic. :D Чак по-добра - едва ли, но в някои отношения е като тях, и използва един друг подход.

Тази версия съдържа около 9000 реда на С#, разработени основно за около 3 месеца.

...

Малко мразя "Смарти", защото понякога ми взимаше здравето... :-S

Ако се намери с кого да го поправим и подобрим, може да го направим страхотен за 3-6-9 месеца. Сам обаче не знам кога ще му отделя внимание, имам около 1000 проекта...


Smarty – Extendable Framework for Bilingual and Multilingual Comprehension Assistants

"Smarty" was my course work while I was an intern at RIILP in Wolverhampton in 2007. It managed to go to the poster session of LREC 2008.



This is context-sensitive translation, applying POS-tagging, Normalization, Multi-word expressions recognition and even a basic bilingual Word-sense disambiguation, using WordNet with bag-of-word methods and aligned to it lexical database, like BalkaNet or EuroWordNet.



It's an Alpha version, consumes a lot of memory, a lot of the interface and the internals need to be fixed and re-engineered.

I need few fellows to do good refactoring and reengineering, some research and improvements of the word-sense disambiguation... access to corpora and web... Some 3-6-9 months work... And I believe "Smarty" might become a really useful tool. :)

But at the moment unfortunately I can't spend a lot of time on it.

2 comments :

Aleksandar Kamburov said...

Здравей,
Всички връзки сочат към toshuniverse.com, който не е достъпен. Преместил ли си някъде съдържанието?

Todor "Tosh" Arnaudov said...

Засега - не. Може би като седна да пусна нова версия.