Настоящата работа представя опит за намиране на следите в изречения на италиански език чрез обучение на статистическия PoS-тагер TnT на Thorsten Brants (Brants, 1999) с обърната банка от дървета на Университета в Торино (Bosco, 2003). Работата започва със запознаване на читателя с понятията нелокална зависимост, граматики на зависимостите, празни елементи. Даден е пример за важността на разпознаването на нелокални зависимости за семантично правилния машинен превод. След това се дефинират понятията “следа”, “проективност” на синтактично-семантична структура от зависимости, във връзка с преобразуването й в конституентно синтактично дърво. Споменават се статистически методи за разпознаване и възстановяване на нелокални зависимости и читателят е насочен към докторската дисертация на Pèter Dienes (Dienes, 2003) от Университета на Заарланд в Заарбрюкен ( Universität des Saarlandes, Saarland University ), която предлага методи за разрешаване на нелокални зависимости за английски език. Работата завършва с доклада за нашия експеримент и с резултатите получени по метода 10-fole cross-validation.
17/3/2006
Тодор Арнаудов
ФМИ на ПУ "Паисий Хилендарски"
Пловдив 4003, бул. България 236
Тодор Арнаудов
ФМИ на ПУ "Паисий Хилендарски"
Пловдив 4003, бул. България 236
Намиране на следите в изречения на италиански.. Арнаудов, 2006
Това беше курсовата ми работа по избираемата дисциплина "Perl за лингвисти", която ми водеше Атанас Чанев, вече подвизаващ се като д-р Чанев. :)
Признавам, че наскоро малко редактирах текста. Едно време не бях съвсем наясно как трябва да се пишат научни статии... :)
0 коментара:
Post a Comment