Вся процедура объединения строится на сочетании дедуктивного  и индуктивного  подходов. Это значит, что объединение, с одной стороны, опирается на уже имеющиеся классификационные иерархии типа УДК или Тезауруса научно-технических терминов, 1972, а с другой — базируется на информации, получаемой с помощью приемов лингвистики текста.

Последовательность операций при объединении тезаурусов должна выглядеть следующим образом.

1.  Выбирается общая научно-техническая классификация, представляемая в виде древовидного графа, и аналогичным образом оформленные отраслевые тезаурусы.

2.  На основании уже имеющихся лингвистических описаний тезаурусов окончаниям  классификационного дерева приписываются наборы КС и КСс, а к узлам привязываются списки ПКС и ПКСс, которые относятся ко всему кусту. Все эти лексические единицы вводятся в списки вместе с их вероятностными или информационными весами, если, разумеется, таковые имеются. Каждому КС, ПКС, КСс и ПКСс приписывается код той ветки или узла, к которым привязана данная лингвистическая единица.

3.  Проверяется соответствие кодов КС, ПКС, КСс и ПКСс их значениям и функциям в отраслевых тезаурусах. На основании этой проверки осуществляется первая коррекция общей иерархической классификации.

4.  Автоматически обрабатываются научно-технические документы по различным областям знаний, в результате чего для каждого документа формируется ПОД, представляющий собой список КС, ПКС, КСс и ПКСс с их статистическими весами.

5.  Каждый ПОД последовательно сравнивается со списками, привязанными к узлам и веткам классификационного дерева. При сравнении учитываются веса лингвистических единиц.

6.  В результате автоматического сравнения, осуществленного в п. 5, происходит пополнение и перераспределение списков КС, ПКС, КСс и ПКСс. Одновременно осуществляется вторичная классификация, объединение или разведение узлов и ветвей дерева с соответствующей коррекцией кодов.

7.  Производится статистическая обработка дефиниций, по результатам которой происходит третья коррекция иерархической классификации. Одновременно достраивается верхняя  часть дерева.

8.  Путем исследования совместной встречаемости терминологических слов и словосочетаний в тексте  выявляются ассоциативные связи, которые затем вводятся в общее классификационное дерево.

Скачал бесплатные программы на этом сайте. Просто супер. Без вирусов и скорость закачки просто огромная.

Наши курсы английского языка для начинающих научат вас разговаривать уже после двух недель занятий.Изучайте язык вместе с нами.

Комментирование закрыто.