РефератыИностранный языкОбОбобщенная грамматика непосредственных составляющих

Обобщенная грамматика непосредственных составляющих

Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ
.


Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ) â íàñòîÿùåå âðåìÿ øèðîêî èñïîëüçóåòñÿ â ïðèêëàäíîé ëèíãâèñòèêå. Åñëè ðàññóæäàòü ìàòåìàòè÷åñêè, ÎÃÍÑ - ýòî âàðèàíò êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Èñòîðè÷åñêè ÎÃÍÑ ðàçâèâàëàñü èç ãðàììàòèêè Ìîíòåãþ (Montague). Ãðàììàòèêîé íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ïðåíåáðåãàëè â òå÷åíèå äâóõ äåñÿòèëåòèé. Çàòåì îêàçàëîñü, ÷òî âñå äîâîäû ïðîòèâ åå îïèñàòåëüíîé íåàäåêâàòíîñòè äëÿ åñòåñòâåííûõ ÿçûêîâ îêàçàëèñü íåâåðíûìè èëè îñíîâàííûìè íà ëîæíûõ ïðåäïîñûëêàõ. Äàííàÿ ãðàììàòèêà î÷åíü õîðîøî âîñïðèíèìàåòñÿ ïðèêëàäíûìè ëèíãâèñòàìè è ïðîãðàììèñòàìè.  Îáîáùåííîé ãðàììàòèêå ÍÑ êîíòåêñòíî-ñâîáîäíàÿ ãðàììàòèêà ÍÑ âûðàæàåòñÿ íå â ÿâíîì âèäå, à ïîñðåäñòâîì ðàçëè÷íûõ ïðèåìîâ, êîòîðûå ïîçâîëÿþò îïðåäåëèòü ëèíãâèñòè÷åñêè çíà÷èìûå îáîáùåíèÿ è ïðåäëàãàþò ïðàâèëà óìíîæåíèÿ, áîëåå êîìïàêòíûå, ÷åì ïðîñòîå ïåðå÷èñëåíèå ïðàâèë.


Òåîðåòè÷åñêîå ïðåäñòàâëåíèå


ÎÃÍÑ îïðåäåëÿåò ñèíòàêñè÷åñêèå êàòåãîðèè êàê íàáîð ñèíòàêñè÷åñêèõ ïðèçíàêîâ. Ñèíòàêñ÷åñêèé ïðèçíàê - ýòî îïðåäåëåíèå, ñîñòîÿùåå èç äâóõ ñèìâîëîâ, îïðåäåëÿþùèõ ñàì ïðèçíàê (íàïðèìåð, ïàäåæ) è åãî çíà÷åíèå (ðîäèòåëüíûé), ëèáî ýòî ìîæåò áûòü ñèíòàêñè÷åñêàÿ êàòåãîðèÿ (ò.å. ïðèçíàêè ìîãóò ïðèíèìàòü êàòåãîðèè â êà÷åñòâå èõ çíà÷åíèé).Ñèíòàêñè÷åñêàÿ êàòåãîðèÿ, òàêèì îáðàçîì, ÿâëÿåòñÿ ÷àñòè÷íî ôóíêöèåé ïåðåõîäà îò ïðèçíàêà ê åãî çíà÷åíèþ. Âíóòðåííåå ñîñòàâëåíèå êàòåãîðèé îãðàíè÷èâàåòñÿ âîçìîæíûìè êîìáèíàöèÿìè ïðèçíàêîâ (Áóëåâû óñëîâèÿ). ñèíòàêñè÷åñêèå ñòðóêòóðû - ýòî äåðåâüÿ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ, êîòîðûå îðãàíèçóþòñÿ ïî âûøåóïîìÿíóòîìó ïðèíöèïó. Ïîñòðîåíèå äåðåâà îñóùåñòâëÿåòñÿ ïî îïðåäåëåííûì ïðàâèëàì: ïðàâèëà çàâèñèìîñòè, ïðàâèëà ëèíåéíîãî ïðåäøåñòâîâàíèÿ, ïðèíöèïû èëëþñòðàöèè ïðèçíàêîâ è ïðàâèëà îïðåäåëåíèÿ îñíîâíûõ ïðèçíàêîâ.


Ïðàâèëà çàâèñèìîñòè ïîçâîëÿþò îäíîìó ñëîâó çàâèñåòü îò äðóãîãî. Íàïðèìåð, S -> NP,VP. Ïðàâèëà çàâèñèìîñòè ëèáî ïåðå÷èñëåíû, ëèáî âûâîäÿòñÿ èç äðóãèõ ìåòàïðàâèëàìè. Ïðàâèëà ëèíåéíîãî ïðåäøåñòâîâàíèÿ îïðåäåëÿþò ïîðÿäîê ïîÿâëåíèÿ êàòåãîðèé. ïðèíöèïû èëëþñòðàöèè ïðèçíàêîâ îñíîâàíû íà äóáëèðîâàíèè ïðèçíàêîâ (ò.å. ñîãëàñîâàíèå ïðèëàãàòåëüíîãî è ñóùåñòâèòåëüíîãî, ãëàãîëà è ñóùåñòâèòåëüíîãî). ïðàâèëà îïðåäåëåíèÿ îñíîâíûõ ïðèçíàêîâ ðàáîòàþò òîãäà, êîãäà êàòåãîðèÿ ìîæåò âñòðåòèòüñÿ, òîëüêî åñëè â ïðåäëîæåíèè íå âñòðåòèëàñü îòðèöàþùàÿ åå êàòåãîðèÿ.


Ïðèìåíåíèå â ïðèêëàäíûõ öåëÿõ


Ðàáîòà ãðàììàòèêè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ïîêðûâàåò òàêèå êàòåãîðèè, êàê ñèñòåìó âñïîìîãàòåëüíûõ ãëàãîëîâ àíãëèéñêîãî ÿçûêà, ñîãëàñîâàíèå, âîïðîñû, îòíîñèòåëüíûå ïðåäëîæåíèÿ, ïàññèâíûå êîíñòðóêöèè, ñî÷åòàíèÿ ñ ñóùåñòâèòåëüíûì è ò.ä. Ýòà ãðàììàòèêà áûëà ðàçðàáîòàíà íå òîëüêî äëÿ àíãëèéñêîãî ÿçûêà, íî òàêæå äëÿ àðàáñêîãî, êàòàëàíñêîãî, êèòàéñêîãî, ãîëëàíäñêîãî, ôðàíöóçñêîãî, íåìåöêîãî, ãðå÷åñêîãî, õèíäè, èðëàíäñêîãî, ÿïîíñêîãî, êîðåéñêîãî, ëàòèíñêîãî, ïîëüñêîãî, èñïàíñêîãî, øâåäñêîãî è óýëüññêîãî.


Ìíîãèå ñîâðåìåííûå ñèñòåìû èñïîëüçóþò ãðàììàòèêó íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Ñàìûé áîëüøîé êîììåð÷åñêèé ïðîåêò ñ èñïîëüçîâàíèåì àíàëèçàòîðà íà îñíîâå ãðàììàòèêè ÍÑ ïðèíàäëåæèò ôèðìå Hewlett Packard è íàçûâàåòñÿ “HPSG”.


Äåðåâî íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ


Äåðåâüÿ ÍÑ ïðåäñòàâëÿþò ñòðóêòóðíîå îïèñàíèå äëÿ ïðåäëîæåíèé. Â äàëüíåéøåì ñòðóêòóðíîå îïèñàíèå ïðåäëîæåíèÿ ìîæåò èñïîëüçîâàòüñÿ â ñèñòåìàõ, àíàëèçèðóþùèõ èëè ñèíòåçèðóþùèõ åñòåñòâåííûé ÿçûê.


Ïðèìåð äåðåâà ÍÑ äëÿ ïðåäëîæåíèÿ:


John wanted to publish the paper.


S


NP VP


VP


NPR V P V NP


DET N


John wanted to publish the paper


Ñîîòâåòñòâóþùàÿ ñòðóêòóðà ñêîáîê:


[S
[NP
[NPR
John]][VP
[V
wanted][VP
[P
to][V
publish][NP
[DET
the][N
paper]]]]]


Äåðåâüÿ ÍÑ è ñòðóêòóðû ñî ñêîáêàìè ÿâëÿþòñÿ òåìè ñòðóêòóðàìè, êîòîðûå ïîðîæäàþòñÿ àíàëèçàòîðîì ñèñòåì, îáðàáàòûâàþùèõ åñòåñòâåííûé ÿçûê.


Ãðàììàòèêè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ


Ãðàììàòèêè ÍÑ ñîñòîÿò èç íàáîðà íåêîíå÷íûõ ñèìâîëîâ (íàïðèìåð, òàêèå êàòåãîðèè, êàê N, V, DET, P, NP, S è ò.ä.), íàáîðà êîíå÷íûõ ñèìâîëîâ (ëåêñè÷åñêèå åäèíèöû òèïà “Äæîí”, “êóïèòü”, “ãàçåòà” è ò.ä.) è íàáîð ïðàâèë, êîòîðûå ïðåîáðàçóþò íåêîíå÷íûå ñèìâîëû â öåïî÷êó êîíåíûõ è íåêîíå÷íûõ ñèìâîëîâ. Åñëè äàííûå ïðàâèëà íå çàâèñÿò îò êîíòåêñòà íåêîíå÷íîãî ñèìâîëà, òî òàêàÿ ãðàììàòèêà íàçûâàåòñÿ êîíòåêñòíî-ñâîáîäíîé; â ïðîòèâíîì ñëó÷àå ãðàììàòèêà íàçûâàåòñÿ êîíòåêñòíî-çàâèñèìîé.


Ãðàììàòèêà ÍÑ â Òðàíñôîðìàöèîííîé ãðàììàòèêå
. Ãðàììàòèêà ÍÑ èãðàåò î÷åíü áîëüøóþ ðîëü â òðàíñôîðìàöèîííîé ãðàììàòèêå. Îñíîâíàÿ èäåÿ Òà çàêëþ÷àåòñÿ â òîì, ÷òî äëÿ ñòðóêòóðíîãî îïèñàíèÿ ñóùåñòâóåò áàçîâûé êîìïîíåíò è, ñîîòâåòñòâåííî, áàçîâûå ïðàâèëà. Âñå îñòàëüíûå ïðàâèëà âûâîäÿòñÿ èç áàçîâû

õ ïóòåì òðàíñôîðìàöèîííûõ ïðàâèë. Äåðåâüÿ, ïîðîæäåííûå òðàíñôîðìàöèîííûìè ïðàâèëàìè, òàêæå ÿâëÿþòñÿ äåðåâüÿìè íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ. Äàííîå ïðåäñòàâëåíèå Òà ÿâëÿåòñÿ ñèëüíî óïðîùåííûì, íî äëÿ äàííîé ðàáîòû åãî âïîëíå äîñòàòî÷íî.


Âîçðîæäåíèå ãðàììàòèêè ÍÑ è äåðåâüåâ ÍÑ


Íà÷èíàÿ ïðèìåðíî ñ 1975 ãîäà â ãðàììàòèêó ÍÑ áûëè âíåñåíû íåêîòîðûå äîïîëíåíèÿ è îáíîâëåíèÿ. Íå âûõîäÿ çà ðàìêè êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè, îáðàçîâàëàñü Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ). Ãðàììàòèêà Ñëîæåíèÿ Äåðåâüåâ (ÃÑÄ) - Tree-Adjoining Grammar - îáðàçîâàëàñü íà îñíîâå ïîñòðîåíèÿ äåðåâüåâ áåç èñïîëüçîâàíèÿ ïðàâèë ïåðåõîäà. Ðàññìîòðèì ýòè äâå ãðàììàòèêè.


Îáîáùåííàÿ ãðàììàòèêà íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ (ÎÃÍÑ)
. Êðîìå âñåõ âûøåóïîìÿíóòûõ ñâîéñòâ ãðàììàòèê ÍÑ Ãàçäàð (Gazdar) ââåë â ÎÃÍÑ äâà íîâûõ ïîíÿòèÿ: “ïóñòûå” êàòåãîðèè (ýëèïñèñ?) è ñâÿçàííûå ïðàâèëà, à òàêæå ìåòàïðàâèëà äëÿ âûâîäà îäíèõ ïðàâèë èç äðóãèõ. Ýëèïñèñ è ñâÿçàííûå ïðàâèëà íå óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü çà ïðåäåëû êîíòåêòñíî-ñâîáîäíîé ãðàììàòèêè. Ìåòàïðàâèëà, åñëè îíè íå îãðàíè÷åíû êàêèìè-ëèáî óñëîâèÿìè, óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü çà ïðåäåëû êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêè, ïîòîìó ÷òî ìåòàïðàâèëî ìîæåò ïîðîæäàòü áåñêîíå÷íûé íàáîð êîíòåêñòíî-ñâîáîäíûõ ïðàâèë, êîòîðûå â ñâîþ î÷åðåäü ïîðîæäàþò êîíòåêñòíî-çàâèñèìûé ÿçûê. Ìåòàïðàâèëà â ðåàëüíûõ ãðàììàòèêàõ, îïèñàííûõ ïî ïðàâèëàì îáîáùåííîé ãðàììàòèêè ÍÑ, äîñòàòî÷íî îãðàíè÷åíû è ïîýòîìó íå óâåëè÷èâàþò ïîðîæäàþùóþ ñïîñîáíîñòü.


Ýëèïñèñ è ñâÿçàííûå ïðàâèëà (íóæíû) ïðåäñòàâëåíû äëÿ áàçîâîãî ïîðîæäåíèÿ “íåñâÿçàííûõ” çàâèñèìîñòåé, êîòîðûå äîëæíû áûòü ó÷òåíû â ïðåäëîæåíèè.


Ïðèìåð ñâÿçàííîãî ïðàâèëà - ýòî ïðàâèëî, êîòîðîå ïðåäñòàâëÿåò ýëèïñèñ äëÿ òîïèêàëèçàöèè, ò.å. íàõîæäåíèÿ òîïèêà â ïðåäëîæåíèè.


Ïîíÿòèå ýëèïñèñà íå íîâîå ïîíÿòèå. Åãî òàêæå óïîìèíàëè Harris, Kuno è Sager. Â êîíòåêñòíî-ñâîáîäíîé ãðàììàòèêå Kuno ñóùåñòâóþò èìåíà óçëîâ ñ ñîîòâåòñòâóþùèìè îïèñàíèÿìè, êîòîðûå îòðàæàþò ïðîïóùåííóþ ñîñòàâëÿþùóþ.


Sager ñîçäàë î÷åíü ïîëíûé àíàëèçàòîð. Åãî èäåè ïåðåïëåòàáòñÿ ñ èäåÿìè Ãàçäàðà. Íî Ãàçäàð áûë ïåðâûé, êòî âíåäðèë ïîíÿòèå ýëèïñèñà è ñâÿçàííûõ ïðàâèë â ôîðìàëüíóþ ðàìêó ñèíòàêñè÷åñêîé òåîðèè è èñïîëüçîâàë ýòî ïîíÿòèå ñèñòåìàòè÷åñêè äëÿ îáúÿñíåíèÿ ñòðóêòóðû äåðåâüåâ.


Ãðàììàòèêà Ñëîæåíèÿ Äåðåâüåâ (ÃÑÄ).
 îáîáùåííóþ ãðàììàòèêó íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ áûëè âíåñåíû íåêîòîðûå èçìåíåíèÿ, à èìåííî: ýòè èçìåíåíèÿ ïîçâîëÿþò ñîçäàâàòü ñòðóêòóðíûå îïèñàíèÿ ïî ïðèíöèïó òðàíñôîðìàöèîííîé ãðàììàòèêè, íî áåç èñïîëüçîâàíèÿ òðàíñôîðìàöèîííûõ ïðàâèë. Ãðàììàòèêà Ñëîæåíèÿ Äåðåâüåâ çàèìñòâîâàëà ó òðàíñôîðìàöèîííîé ãðàììàòèêè òåõíîëîãèþ ïîñòðîåíèÿ äåðåâüåâ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ïî îïðåäåëåííûì ïðàâèëàì ïîñòðîåíèÿ äåðåâüåâ.


ÃÑÄ ñîñòîèò èç íàáîðà “íà÷àëüíûõ” äåðåâüåâ è íàáîðà äîïîëíèòåëüíûõ äåðåâüåâ, à òàêæå îïåðàöèè Ñëîæåíèÿ. Íà÷àëüíûå è äîïîëíèòåëüíûå äåðåâüÿ âìåñòå íàçûâàþòñÿ áàçîâûìè äåðåâüÿìè.


Äåðåâî À íàçûâàåòñÿ “íà÷àëüíûì äåðåâîì”, åñëè îíî èìååò ôîðìó:


S


A =





Êîíå÷íûå ñèìâîëû


Êîðíåâîé óçåë îòìå÷åí ñèìâîëîì S, ïîãðàíè÷íûå óçëû ÿâëÿþòñÿ êîíå÷íûìè ñèìâîëàìè. Âíóòðåííèå óçëû - íåêîíå÷íûå ñèìâîëû.


Äåðåâî Â íàçûâàåòñÿ “äîïîëíèòåëüíûì”, åñëè îíî èìååò ôîðìó:


Õ


 =


Õ


Êîíå÷íûå Êîíå÷íûå


Îïåðàöèÿ Ñëîæåíèÿ ñîñòîèò â òîì, ÷òî “íà÷àëüíîå” äåðåâî êàê áû íàêëàäûâàåòñÿ íà “äîïîëíèòåëüíîå” äåðåâî ïî êîðíåâîìó óçëó.


ÃÑÄ áîëåå ìîùíàÿ, ÷åì êîíòåêñòíî-ñâîáîäíàÿ ãðàììàòèêà. Ñóùåñòâóþò ÿçûêè, êîòîðûå ìîãóò áûòü ïîðîæäåíû ÃÑÄ, íî íå ÊÑà (íàïðèìåð, êîíòåêñòíî-çàâèñèìûå ÿçûêè).


ÃÑÄ èëëþñòðèðóåò, êàê äåðåâüÿ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ ìîãóò áûòü ïîëó÷åíû èç áàçîâûõ äåðåâüåâ.  îòëè÷èå îò òðàíñôîðìàöèîííîé ãðàììàòèêè ýòî äîñòèãàåòñÿ íå ñ ïîìîùüþ òðàíñôîðìàöèîííûõ ïðàâèë, à ñ ïîìîùüþ îïåðàöèè Ñëîæåíèÿ. ÃÑÄ ìîæåò ïîðîæäàòü äåðåâüÿ ñ ïåðåñåêàþùèìèñÿ çàâèñèìîñòÿìè.


Ðåçþìå


Äåðåâüÿ íåïîñðåäñòâåííûõ ñîñòàâëÿþùèõ îáåñïå÷èâàþò âîçìîæíîñòü ñòðóêòóðíîãî îïèñàíèÿ ïðåäëîæåíèé. Äåðåâüÿ ÍÑ ìîãóò áûòü ïîðîæäåíû ãðàììàòèêàìè ÍÑ. Äåðåâüÿ ÍÑ ìîãóò èñïîëüçîâàòüñÿ äëÿ õàðàêòåðèñòèêè ñòðóêòóðíîãî îïèñàíèÿ ïðåäëîæåíèé, âêëþ÷àÿ òå àñïåêòû, êîòîðûå îáû÷íî õàðàêòåðèçîâàëèñü òðàíñôîðìàöèîííûìè ãðàììàòèêàìè. Ýòè õàðàêòåðèñòèêè ïðåäïîëàãàþò âíåñåíèå èçìåíåíèé â êîíòåêñòíî-ñâîáîäíóþ ãðàììàòèêó, íå óâåëè÷èâàÿ åå ïîðîæäàþùóþ ñïîñîáíîñòü, èëè ïîðîæäåíèå ïðåäëîæåíèé èç àçîâûõ äåðåâüåâ ñ ïîìîùüþ îïåðàöèè Ñëîæåíèÿ, ÷òî âñå æå íåñêîëüêî óâåëè÷èâàåò ïîðîæäàþùóþ ñïîñîáíîñòü. Ñòðóêòóðíûå îïèñàíèÿ, ñäåëàííûå ñ ïîìîùüþ äåðåâüåâ ÍÑ, èñïîëüçóþòñÿ íåïîñðåäñòâåííî èëè â íåÿâíîì âèäå â ñèñòåìàõ, îïèñûâàþùèõ åñòåñòâåííûé ÿçûê.

Сохранить в соц. сетях:
Обсуждение:
comments powered by Disqus

Название реферата: Обобщенная грамматика непосредственных составляющих

Слов:1087
Символов:56321
Размер:110.00 Кб.