Wednesday, March 26, 2008

Намиране на следите в изречения на италиански език чрез статистически методи за машинно обучение и банка от дървета

Настоящата работа представя опит за намиране на следите в изречения на италиански език чрез обучение на статистическия PoS-тагер TnT на Thorsten Brants (Brants, 1999) с обърната банка от дървета на Университета в Торино (Bosco, 2003). Работата започва със запознаване на читателя с понятията нелокална зависимост, граматики на зависимостите, празни елементи. Даден е пример за важността на разпознаването на нелокални зависимости за семантично правилния машинен превод. След това се дефинират понятията “следа”, “проективност” на синтактично-семантична структура от зависимости, във връзка с преобразуването й в конституентно синтактично дърво. Споменават се статистически методи за разпознаване и възстановяване на нелокални зависимости и читателят е насочен към докторската дисертация на Pèter Dienes (Dienes, 2003) от Университета на Заарланд в Заарбрюкен ( Universität des Saarlandes, Saarland University ), която предлага методи за разрешаване на нелокални зависимости за английски език. Работата завършва с доклада за нашия експеримент и с резултатите получени по метода 10-fole cross-validation.

17/3/2006
Тодор Арнаудов
ФМИ на ПУ "Паисий Хилендарски"
Пловдив 4003, бул. България 236



Намиране на следите в изречения на италиански.. Арнаудов, 2006

Това беше курсовата ми работа по избираемата дисциплина "Perl за лингвисти", която ми водеше Атанас Чанев, вече подвизаващ се като д-р Чанев. :)

Признавам, че наскоро малко редактирах текста. Едно време не бях съвсем наясно как трябва да се пишат научни статии... :)

No comments :