Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.

Обратная связь

Презентация на тему Классификация грамматик и языков

Содержание

2. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
3. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
4. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
5. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
6. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
7. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
8. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
9. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
10. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
11. Троицкий Д.И. Лингвистическое и программное обеспечение САПР
12. Скачать презентацию
13. Похожие презентации

Троицкий Д.И. Лингвистическое и программное обеспечение САПР 4 типа грамматик по Хомскому:V+ — множество всех цепочек над алфавитом V без λ;V* — множество всех цепочек над алфавитом V, включая λ.

Главная
Русский язык
Классификация грамматик и языков

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Классификация грамматик и языковЛекция

Троицкий Д.И. Лингвистическое и программное обеспечение САПР 4 типа грамматик по Хомскому:V+

Троицкий Д.И. Лингвистическое и программное обеспечение САПР При построении предложений КЗ-грамматик один

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Неукорачивающие грамматики имеют такую структуру

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Регулярные грамматики используются при описании

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Классификация языковТип 0: языки с

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Тип 1: контекстно-зависимые (КЗ) языкиТип

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Тип 2: контекстно-свободные (КС) языкиКС-языки

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Чем все это безобразие распознаватьДля

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Экспоненциальная зависимость времени разбора от

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Пример: грамматика целых десятичных чиселG1{0,1,2,3,4,5,6,7,8,9,-,+},{S,

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Та же грамматика, но по-другому:G1'

Слайды презентации

Слайд 2 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
4

Троицкий Д.И. Лингвистическое и программное обеспечение САПР 4 типа грамматик по

типа грамматик по Хомскому:
V+ — множество всех цепочек над

алфавитом V без λ;
V* — множество всех цепочек над алфавитом V, включая λ.

Слайд 3 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
При

Троицкий Д.И. Лингвистическое и программное обеспечение САПР При построении предложений КЗ-грамматик

построении предложений КЗ-грамматик один и тот же нетерминальный символ

может быть заменен на ту или иную цепочку символов в зависимости от того контекста, в котором он встречается.

Цепочки α1 и α2 в правилах грамматики обозначают контекст (α1— левый контекст, а α2 — правый контекст), в общем случае любая из них (или даже обе) может быть пустой. Говоря иными словами, значение одного и того же символа может быть различным в зависимости от того, в каком контексте он встречается.

При построении компиляторов такие грамматики не применяются

Слайд 4 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Неукорачивающие

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Неукорачивающие грамматики имеют такую

грамматики имеют такую структуру правил, что при построении предложений

языка, заданного грамматикой, любая цепочка символов может быть заменена на цепочку символов не меньшей длины.

КС-грамматики широко используются при описании синтаксических конструкций языков программирования. Синтаксис большинства известных языков программирования основан именно на КС-грамматиках

Слайд 5 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Регулярные

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Регулярные грамматики используются при

грамматики используются при описании простейших конструкций языков программирования: идентификаторов,

констант, строк, комментариев и т. д.

Для классификации грамматик всегда выбирают максимально возможный тип, к которому она может быть отнесена. Сложность грамматики обратно пропорциональна номеру типа, к которому относится грамматика. Грамматики, которые относятся только к типу 0, являются самыми сложными, а грамматики, которые можно отнести к типу 3 — самыми простыми.

Слайд 6 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Классификация

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Классификация языковТип 0: языки

языков

Тип 0: языки с фразовой структурой
Это самые сложные языки,

которые могут быть заданы только грамматикой, относящейся к типу 0. Если язык относится к типу 0, то для него невозможно построить компилятор, который гарантированно выполнял бы разбор предложений языка за ограниченное время на основе ограниченных вычислительных ресурсов.

К сожалению, все естественные языки относятся к фразовым. Структура и значение фразы естественного языка может зависеть не только от контекста данной фразы, но и от содержания того текста, где эта фраза встречается. Одно и то же слово в естественном языке может не только иметь разный смысл, в зависимости от контекста, но и играть различные роли в предложении. Именно поэтому столь велики сложности в автоматизации перевода текстов, написанных на естественных языках

Слайд 7 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Тип

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Тип 1: контекстно-зависимые (КЗ)

1: контекстно-зависимые (КЗ) языки
Тип 1 — второй по сложности

тип языков. В общем случае время на распознавание предложений языка, относящегося к типу 1, экспоненциально зависит от длины исходной цепочки символов.

Языки и грамматики, относящиеся к типу 1, применяются в анализе и переводе текстов на естественных языках. Распознаватели, построенные на их основе, позволяют анализировать тексты с учетом контекстной зависимости в предложениях входного языка (но они не учитывают содержание текста, поэтому для точного перевода с естественного языка требуется вмешательство человека). На основе таких грамматик может выполняться автоматизированный перевод с одного естественного языка на другой, ими могут пользоваться сервисные функции проверки орфографии и правописания в языковых процессорах.

В компиляторах КЗ-языки не используются

Слайд 8 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Тип

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Тип 2: контекстно-свободные (КС)

2: контекстно-свободные (КС) языки
КС-языки лежат в основе синтаксических конструкций

большинства современных языков программирования,

Тип 3: регулярные языки
Регулярные языки — самый простой тип языков. Поэтому они являются самым широко используемым типом языков в области вычислительных систем. Время на распознавание предложений регулярного языка линейно зависит от длины входной цепочки символов.

Регулярные языки лежат в основе простейших конструкций языков программирования (идентификаторов, констант и т. п.), кроме того, на их основе строятся языки ассемблеров, а также командные процессоры, символьные управляющие команды и другие подобные структуры.

Слайд 9 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Чем

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Чем все это безобразие

все это безобразие распознавать
Для языков с фразовой структурой (тип

0) необходим распознаватель, имеющий неограниченную внешнюю память. Поэтому для языков данного типа нельзя гарантировать, что за ограниченное время на ограниченных вычислительных ресурсах распознаватель завершит работу и примет решение о том, принадлежит или не принадлежит входная цепочка заданному языку. Практического применения языки с фразовой структурой не имеют.

Для контекстно-зависимых языков (тип 1) распознавателями являются двусторонние недетерминированные автоматы с ограниченной памятью. Количество шагов, необходимых автомату для распознавания входной цепочки, экспоненциально зависит от длины этой цепочки.

Слайд 10 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Экспоненциальная

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Экспоненциальная зависимость времени разбора

зависимость времени разбора от длины цепочки существенно ограничивает применение

распознавателей для контекстно-зависимых языков. Такие распознаватели применяются для автоматизированного перевода и анализа текстов на естественных языках, когда временные ограничения на разбор текста несущественны.

Для контекстно-свободных языков (тип 2) распознавателями являются односторонние недетерминированные автоматы с магазинной (стековой) внешней памятью — МП-автоматы. При простейшей реализации алгоритма работы такого автомата он имеет экспоненциальную сложность, однако путем некоторых усовершенствований алгоритма можно добиться полиномиальной (кубической) зависимости времени, необходимого на разбор входной цепочки, от длины этой цепочки. Следовательно, можно говорить о полиномиальной сложности распознавателя для КС-языков.

Слайд 11 Троицкий Д.И. Лингвистическое и программное обеспечение САПР
Пример:

Троицкий Д.И. Лингвистическое и программное обеспечение САПР Пример: грамматика целых десятичных

грамматика целых десятичных чисел
G1{0,1,2,3,4,5,6,7,8,9,-,+},{S, Т, F},P1,S):
P1:
S  Т |

+Т | -Т
Т  F | TF
F  0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

По структуре своих правил данная грамматика G1 относится к контекстно-свободным грамматикам (тип 2). Ее можно отнести и к типу 0, и к типу 1, но максимально возможным является именно тип 2, поскольку к типу 3 эту грамматику отнести никак нельзя:
строка Т  F | TF содержит правило Т  TF, которое недопустимо для типа 3, и хотя все остальные правила этому типу соответствуют, одного несоответствия достаточно.