Готовые Домашние Задания

Рефераты по теме

Реферат Дерево непосредственных составляющих

Скачать реферат↓ [8.05 KB]



Текст реферата Дерево непосредственных составляющих

Дерево непосредственных составляющих (ДНС) обеспечиваает структорное
описание предложений. Граматика непосредственных составляющих (ГНС)
характеризует ДНС. И то и другое поэтому играют важную роль в
обработке естественного языка для создания структурных описаний
предложения, которые могут быть использованы в обработке систем
понимания или порожления речи.
Дерево непосредственных составляющих:
ДНС кодирует иерархическую структуру предложения. Эта информация двух
видов: иерархическая структура группирования и синтаксические
категории этих группирований.
Предложение
John wanted to publish the paper. (1)
имеет следующую структуру
(2)
John wanted to publish
the paper
Эта структура может быть представлена и в скобочной конструкции:
[[John][[wanted][[to][publish][[the][paper]]]]] (3)
(2) и (3) описывают группирование без идентификации составляющих.
Такие конструкции называются “скелетом”. Скелеты
характеризуют фразу без обозначения вершин дерева. Скелет с
обозначением категорий является ДНС, для фразы (1) это будет выглядеть
так
S
NP VP
VP
NP (4)
NPR V P V
DET N
John wanted to publish
the paper
“John” является здесь именем собственным, которое является
также группой подлежащего, “wanted” и “publish”
глаголы, “to”предлог (точнее говоря “to” должно
быть названо частицей или временем), “the” детерминатор,
“paper” существительное, “the paper” группа
существительного, “to publish the paper” группа сказуемого,
“wanted to publish the paper” тоже группа сказуемого, и
наконец, “John wanted to publish the paper” предложение.
Соответственно скобочная конструкция (3) будет выглядеть так:
[S[NR[NPR John ]][VP[V to ][V publish ][NP[DET the ][N paper
]]]]] (5)

Конструкции (4) и (5) обычно (но не всегда) используются в системах
обработки естественного языка.
Грамматика непосредственных составляющих (ГНС)
ГНС состоит из набора нетерминальных символов (таких как N, V, NP,
VP, S и т.д.) и из набора терминальных символов (таки лексические
единицы как John “wanted”, “to”,
“publish”, “the”, “paper” и т. д. и из
набора правил, которые позволяют переписывать нетерминальные символы в
цепочку терминальных и нетерминальных симвлов. Если это переписывание
не зависит от контекста, то это контекстонезависимая грамматика (КНГ),
в противном случае это контекстозависимая грамматика (КЗГ). Правило
перезаписи имеет следующую форму:
А --> Х (6)
где Х последовательсть терминальных и нетерминальных символов, а А
нетерминальные.
КЗГ имеет иследующее правило перезаписи
ZAW --> ZXW (7)
где X, Z, W цепочки терминальных и нетерминальных символов, а А
нетерминальные.
В (7) А и Х находятся в окружении Z и W. Часто эта формула пишется в
виде
A --> X Z — W (8)
Деревация в КНГ начинается с начального символа S и далее идет до тех
пор, пока не будет применено последнее правило.