Leksikon-gramatika

Извор: testwiki
Пређи на навигацију Пређи на претрагу

Leksikon-gramatika predstavlja metodu i praktičan način formalnog opisivanja jezika.[1] Za njenog začetnika uzima se Moris Gros koji je pravljenjem leksikon-gramatike za francuski počeo da se bavi šezdesetih godina.[2] Teorijska osnova na kojoj se zasniva leksikon-gramatika je distribucionalizam Zeliga S. Harisa,[3][4] posebno pojam transformacije. Kovencije za obeležavanje gramatičkih informacija napravljene su s namerom da budu što jednostavnije i transparentnije. Metodologija leksikon-gramatike potiče od eksperimentalnih nauka[5]. U njima je naglasak stavljen na prikupljanje činjenica na račun realnosti jezičke upotrebe, i to sa kvantitativne (sistematičan opis leksike)i kvalitativne tačke gledišta (metodološke predostrožnosti). Leksikon-gramatika postavlja i zahtev za formalizacijom. Rezultati opisa moraju biti dovoljno formalizovani da bi lingvisti-informatičari mogli da pristupe automatskoj obradi jezika, pre svega pomoću sintaksičkih parsera.[6][7] U formalnom modelu leksikon-gramatike rezultati opisa su dati u obliku tabela zvanih tablice ili matrice, u kojima se leksička jedinica ukršta sa sintaksičko-sematičkim svojstvima.[8] Dobijeni rezultati su osnova sintaksičko-semantičkih informacija.

Teorijska osnova

Teorijska osnova na kojoj se zasniva leksikon-gramatika je distribucionalizam Zeliga S. Harisa[3][4], posebno pojam transformacije u značenju Zeliga Harisa. Moris Gros je bio učenik Zeliga Harisa. Kovencije za obeležavanje gramatičkih informacija napravljene su s namerom da budu što jednostavnije i što transparentnije. Ovaj zahtev potiče od Zeliga Harisa, čija je teorija okrenuta prema neposrednom, za razliku od generativne gramatike koja se bavi apstraktnim strukturama, kao što su dubinska struktura i površinska struktura[9].

Prikupljanje činjenica

Metodologija leksikon-gramatike potiče od eksperimentalnih nauka.[5] Ona stavlja naglasak na prikupljanje činjenica na račun konkretne jezičke upotrebe, i to sa kvantitativne i kvalitativne tačke gledišta.

Kvantitativno : leksikon-gramatika podrazumeva sistematičnan opis leksike. Kako je ovo posao velikih razmera, ostvariv samo uz pomoć ekipa, a ne pojedinačnih stručnjaka. Ispitivanje isključivo opštih pravila sintakse, nezavisno od leksičkog materijala na koji se primenjuju, pokazalo se kao nedovoljno dobro[10]. U tome leži razlika u odnosu na generativnu gramatiku, koja svoje težište ima na opštosti.[9]

Kvantitativno : niz metodoloških predostrožnosti primenjuje se kako bi se obezbedila dobra obnovljivost zapažanja, i pre svega kako bi se sprečio rizik od veštačkog konstruisanja primera.[11] Jedna od predostrožnosti ogleda se u prihvatanju elementarne rečenice kao minimalne jedinice značenja,[12] budući da reč dobija precizno značenje tek u kontekstu. Štaviše, ubacivanjem reči u rečenicu, dobija se prednost manipulisanja nizom pogodnim za ocenjivanje kao prihvatljivog ili neprihvatljivog. Po ovu cenu se sintaksičko-sematnička svojstva mogu smatrati definisanim s dovoljno preciznosti, da bi imalo smisla porediti ih sa čitavim leksikonom. Ove predostrožnosti su se razvijale srazmerno potrebama i pojavom novih tehničkih sredstava. Tako su s početkom devedesetih saradnici na leksikon-gramatici mogli sve lakše da dobiju pomoć primera potvrđenih na korpusu.[13] Ova nova predostrožnost je samo dodata na prethodne, čineći leksikon-gramatiku metodom koja se istovremeno i oslanja na lingvističku introspekciju i lingvistički korpus, kao što je predlagao i Čarls Filmor[14]. Les projets américains FrameNet[15] et VerbNet[16] ukazujući time na relativnu bliskost sa ciljevima leksikon-gramatike.

Formalizacija

Leksikon-gramatika takođe postavlja i zahtev za formalizacijom. Rezultati opisa moraju biti dovoljno formalizovani kako bi omogućili:

Ovaj zahtev za formalizacijom manifestuje se kroz usvajanje posebnog informatičkog modela sintakse i semantike. Tako je i prihvatljivost modelirana kao binarno svojstvo: za potrebe deskripcije, jedna rečenica može biti smatrana za prihvatljivu ili neprihvatljivu, kao i u generativnoj gramatici i to s istim razlogom. Isto tako, leksička dvosmislenost se predstavlja pažljivim razdvajanjem reči od ukupnog broja leksičkih unosaka, koji se razlikuju jednako kao i dva leksička unoska morfološki različitih reči (na primer, različita značenja reči manquer imaće različite leksičke unoske). Sintaksičko-semantička svojstva leksičkih unosaka (na primer strukture rečenica u kojima se dati glagol može pojaviti, ili distribucija subjekta) formiraju listu koja se sistematično sučeljavaju sa svim leksičkim unoscima. Oni su obeleženi dosta neformalno obleženi kao N0VN1W=N1VW, što predstavlja transformaciju dve rečenične strukture (ili sintaksičke konstrukcije) bitne za jedan leksički unosak. Pojam leksičkog unoska se na taj način ne meša sa pojmom sintaksičke konstrukcije. Zato se i izbegava termin "supkategorizacioni okvir", koji se često koristi u kontekstu modela po kojima su ova dva pojma u odnosu bijekcije. U okviru leksikon-gramatike odluke o klasifikaciji ("supkategorizaciji") leksičkog unoska baziraju se apriori na celokupnosti sintaksičkih konstrukcija formiranih od datog leksičkog unoska, a ne na osnovu jedne konstrukcije ("okvira"). Najzad, usvajaju se samo ona svojstva za koja je moguće pronaći proceduru koja će omogućiti da se odredi dovoljno pouzdan način da se odredi da li je dati lingvistički unosak poseduje ili ne. Takva procedura se određuje eksperimentalno tako što se na proširenom vokabularu testira obnovljivost sudova. Svojstva se tako modeliraju binarno a ne kao kontinuumi. U skladu sa ovim formalnim modelom, suština opisa jednog jezika sastoji se u specifikovanju svojstava leksičkih jedinica. Rezultati opisa tako prirodno uzimaju oblik tabela s duplim unosom, zvanih tablice ili matrice, u kojima se leksički unosci ukrštaju sa sintaksičko-semantičkim svojstvima[8]. Opis strukture rečenica stavlja u igru identifikaciju svih argumenata karakterističnih za svaki od glagolskih unosaka; pre svega se primenjuju principi za razlikovanje argumenata (subjekata i objekata ili dopuna) od odredbi.

Rezultati

Rezultati koje je desetina lingvista u toku desetak godina dobila primenom navedenih metodoloških principa čine bazu sintaksičko-semantičkih informacija za automatsku obradu jezika|. O kvalitetu ove baze možemo suditi uzimajući u obzir:

  • njen obim, meren brojem unosaka,
  • bogatstvo jezičkih fenomena koje uzima u obzir, mereno brojem svojstava
  • i njen stepen formalizacije.

Za francuski jezik postoji preko 75.000 unosaka[17] ; manje ili više iscrpni opisi, koji uvek prate isti model, postoje i za desetinu drugih jezika, pri čemu su italijanski jezik, portugalski jezik, grčki jezik i korejski jezik najreprezentativniji[18], le portugalski jezik[19], le grčki jezik[20] et le korejski jezikШаблон:Чињеница.

Rad na predikatskim imenicama bio je završen i objavljen pod okriljem leksikon-gramatike u toku sedamdesetih[21], a rad na ustaljenim izrazima u toku osamdesetih[22].

Pojam predikatske imenice potiče iz radova Zeliga Harisa[23]. Zasnovan je na ideji da ako, na primer, glagol proučavati analiziramo kao predikat u rečenici Luka proučava pomračenja Sunca, prirodno je analizirati imenicu proučavanje (ili nisku vršiti proučavanje) kao predikat u rečenici Luka vrši proučavanje pomračenja Sunca. U ovom slučaju, data imenica je izražena predikativno. Glagol koji joj prethodi, ovde vršiti kvalifikuje se kao glagol podrške. Ova ideja je primenjivana sistematično u okviru leksikon-gramatike počevši od sedamdesetih[21][24][25][26]. Saradnici na leksikon-gramatici govore o ustaljenim izrazima kada izraz (na primer stati na ludi kamen) ima specifična svojstva (ovde, svoje značenje) koje opravdava unošenje istog kao jednog od leksičkih unosaka, iako se sastoji iz više elemenata (stati, na, ludi i kamen) koji, na ovaj ili onaj način, mogu biti smatrani rečima[22]. Sistematičan opis ovih izraza je započet u okviru leksikon-gramatike od osamdesetih[27][28][29].

Kumulativnost

Iskustvo je pokazalo da nekoliko pojedinaca ili ekipa može doći do istih rezultata. Ova obnovljivost osigurava kumulativnost opisa. Ovaj rezultat je od ključnog značaja za automatsku obradu jezika u budućnosti: količina podataka koji treba da budu sakupljeni i predstavljeni u okviru koherentnog modela je tolika da brojne ekipe za istraživanje i razvoj moraju da sarađuju i moraju da da spoje svoje rezultate tako da se suštinski delovi gramatike i leksike ne moraju iznova pisati za svaki jezik. Ovaj zahtev je još uvek daleko od jednostavnog rešenja, budući da nema puno primera gramatika značajnog obima koje nisu delo pojedinačnih stručnjaka.

Референце

Шаблон:Reflist

Литература

Vidi još

Povezani članci

Spoljašnje veze

Bibliografija

  • Boons, Jean-Paul ; Alain Guillet ; Christian Leclère. 1976. La structure des phrases simples en français. Constructions intransitives, Genève : Droz.Шаблон:Fr
  • Guillet, Alain ; Christian Leclère. 1992. La structure des phrases simples en français. Constructions transitives locatives, Genève : Droz.Шаблон:Fr
  • Gross, Maurice. 1994. Constructing Lexicon-grammars, in Computational Approaches to the Lexicon, Atkins and Zampolli (eds.), Oxford University Press, pp. 213-263.Шаблон:Fr

Шаблон:Normativna kontrola

  1. Шаблон:FrIbrahim, Amr Helmy. 2003. Le cadre du lexique-grammaire. Linx 48:101-122.
  2. Gross, Maurice. 1968. Grammaire transformationnelle du français. Vol. 1, Syntaxe du verbe. Paris : Larousse (reizdanje pod istim naslovom, Paris: Cantilène, 1986).
  3. 3,0 3,1 Шаблон:En Harris, Zellig. 1964. "Transformations in Linguistic Structure", Proceedings of the American Philosophical Society 108:5, pp. 418-122.
  4. 4,0 4,1 Шаблон:Cite book
  5. 5,0 5,1 Lamiroy, Béatrice. 2003. "In memoriam Maurice Gross", Travaux de linguistique 46:1, pp. 145-158.
  6. 6,0 6,1 Michel Delamar, Maurice Gross, -{R|http://www.univ-paris-diderot.fr/2001/pres011212.htm}- Шаблон:Wayback
  7. 7,0 7,1 Roche, Emmanuel, 1997, "Parsing with Finite-State Transducers", in Finite-State Language Processing, Cambridge, Mass./ London, MIT Press.
  8. 8,0 8,1 Gross, Maurice. 1975. Méthodes en syntaxe. Le régime des constructions complétives. Paris : Hermann.
  9. 9,0 9,1 Syntactic Structures - Noam Chomsky, David W. Lightfoot - Google Књиге
  10. Шаблон:En Gross, Maurice. 1979. On the failure of generative grammar. Language 55:4, pp. 859-885.
  11. Gross, Maurice, A linguistic environment for comparative Romance syntax, Papers from the XIIth Linguistic Symposium on Romance Languages, 1984, pp. 373-446, Amsterdam/Philadelphia: John Benjamins.
  12. Gross, Maurice. 1988. Methods and Tactics in the Construction of a Lexicon-Grammar. In Linguistics in the Morning Calm 2, Selected Papers from SICOL 1986, pp. 177-197, Séoul : Hanshin Pub. Co.
  13. Pre svega zahvaljujući softveru Intex koji je razvio Maks Silberštajn.
  14. Шаблон:En Fillmore, Charles. 1992. "'Corpus linguistics' vs. 'Computer-aided armchair linguistics'". Directions in Corpus Linguistics, Mouton de Gruyter, pp. 35-60. (Proceedings from a 1992 Nobel Symposium on Corpus Linguistics, Stockholm.)
  15. Шаблон:En Baker, Collin F., Charles J. Fillmore, Beau Cronin. 2003. "The Structure of the Framenet Database", International Journal of Lexicography 16.3, pp. 281-296.
  16. Шаблон:En Kipper-Schuler, Karin, Anna Korhonen, Neville Ryant, Martha Palmer. 2006. "Extending VerbNet with Novel Verb Classes". Proceedings of the International Conference on Language Resources and Evaluation (LREC), Genoa.Шаблон:Мртва веза
  17. Gross, Maurice. 2006. État du lexique-grammaire du français et perspectives d'extension. History of the Language Sciences, tome 3, Sylvain Auroux et al. (eds.), Berlin-New York: Walter de Gruyter, pp. 2122-2129.
  18. Шаблон:En D'Agostino, Emilio, Annibale Elia, & Simonetta Vietri. 2004. "Lexicon-Grammar, Electronic Dictionaries and Local Grammars of Italian", Lexique, syntaxe et lexique-grammaire. Papers in honour of Maurice Gross, Coll. Lingvisticae Investigationes Supplementa, 24, Amsterdam/Philadelphia : Benjamins, pp. 125–136.
  19. Шаблон:En Ranchhod, Elisabete; P. Carvalho; C. Mota; A. Barreiro, "Portuguese Large-scale Language Resources for NLP Applications". In Proceedings of the 4th LREC, pp. 1755-1758, Lisbon.
  20. Kyriacopoulou, Tita. 2004. Analyse automatique des textes écrits : le cas du grec moderne. Thessaloniki : University Press.
  21. 21,0 21,1 Labelle, Jacques. 1974. "Le substantif symétrique". Cahiers de Linguistique 5, pp. 17-49, Montréal: UQAM.
  22. 22,0 22,1 Gross, Maurice. 1982. Une classification des phrases "figées" du français. Revue Québécoise de Linguistique 11.2, pp. 151-185, Montréal: UQAM.
  23. Шаблон:En Harris, Zellig, 1964. "The Elementary transformations", Transformations and Discourse Analysis Papers, 54, Philadelphie, Université de Pennsylvanie (republié dans Papers in Structural and Transformational Linguistics, 1970, Dordrecht:Reidel).
  24. Giry-Schneider, Jacqueline. 1978. Les nominalisations en français. L'opérateur faire dans le lexique. Genève: Droz.
  25. Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en français. Les phrases simples à verbe support. Genève: Droz.
  26. Gross, Gaston. 1989. Les constructions converses du français, Genève : Droz.
  27. Danlos, Laurence. 1981. La morphosyntaxe des expressions figées. Langages 63, pp. 53-74, Paris : Larousse. pdf Шаблон:Wayback
  28. Шаблон:En Gross, Maurice. 1986. "Lexicon-Grammar. The Representation of Compound Words". In COLING-1986 Proceedings, Bonn, pp. 1-6. pdf
  29. Шаблон:Pt Ranchhod, Elisabete. 1990. Sintaxe dos Predicados Nominais com Estar. Linguistica 1-2, Lisboa: Instituto Nacional de Investigaçao Cientifica.