Monday, June 15, 2020

Smarty - Смарти - най-мощният интелигентен английско-български речник (помощник в разбирането, Comprehension Assistant)

"Smarty" - ако ползвате английско-български речници или ви трябват справки от време на време или искате да учите думи, пробвайте прототипа на моя интелигентен английско-български речник, "Comprehension Assistant', който отново се появява на белия свят*.

http://twenkid.com/smarty/Smarty-2007-Comprehension-Assistant-Release-6-2020.zip

Ръководство и описание на функциите, дипломната работа, презентации на английски и български и научната статия:

http://twenkid.com/smarty/

       Доколкото ми беше известно, той беше най-авангардната подобна система в света в момента на направата си - поне известна на мен и там където бях, а мястото беше една от "петте водещи изследователски групи в Англия" в тази сфера, както ако не греша веднъж ни надъха научния ми ръководител. Ако не беше така, проектът нямаше да мине пред него, настояваше за "научен принос", и системата наистина мина през ситото на LREC и IMCSIT. Имаше само два известни комерсиални подобни "интелигентни речници" - един на Xerox Research с по-прост интерфейс и един друг, а онези, които се използваха масово, бяха примитивни, напр. SADict или уеб сайтове, където тогава се работеше тромаво.
        В "Смарти" може да се посочват думите от цял копиран текст, без да ги въвеждаш или маркираш една по една. Една проста, но забавна функция е търсене по окончания на думи, друга - показване на изразите подредени по азбучен ред и прегледно (а не като в САДикт да трябва да ровиш в статията). Разпознаване на изрази - не само точни съвпадения, а и с вариации (можеше да спряга глаголи, да намира основни форми и пр.). История на проверените думи. Достъп до семантичния речник-онтология WordNet и до BalkaNet. Копиране на цялото съдържание в клипборда (търсения, предложени думи, статии в WordNet) и т.н.
* Той беше пуснат в една малко по-късна версия, но после изчезна като мигрирах един сайт. Като изровя малко по-новата версия ще пусна и нея
http://artificial-mind.blogspot.com/2008/07/smarty-extendable-framework-for.html  (не работят линковете)
          За информатици: проектът беше с обем около 9000 реда код на С#, разработени за 3 месеца от нулата. Със сигурност може да се съкратят разни неща или да са по-"културни", въобликът (интерфейсът) можеше да е по-гъвкав (и поне да се преоразмерява) и др., но не стигаше времето и постоянно трябваше да решавам да направя ли това или онова и как, и дали си струва да го подобрявам, да проучвам и т.н. Беше разработван с оптимизация на "скоростта на писане".
         WordNet и BalkaNet напр. се наложи да ги "хакна", тъй като не намерих пряк програмен интерфейс за C# какъвто ми трябваше, може би въобще не е имало такива тогава. Затова разгледах съдържанието на файловете, на WordNet, някаква база данни, което се оказа в текстов формат и му разбрах кое какво значи. На BalkaNet беше прост XML и доколкото си спомням ми се стори по-лесно сам да си напиша "парсер", вместо да търся и да включвам библиотеки. Речниковата база данни имаше нужда от по-сложен парсър и т.н.

No comments :