Вся процедура объединения строится на сочетании дедуктивного и индуктивного подходов. Это значит, что объединение, с одной стороны, опирается на уже имеющиеся классификационные иерархии типа УДК или Тезауруса научно-технических терминов, 1972, а с другой — базируется на информации, получаемой с помощью приемов лингвистики текста.
Последовательность операций при объединении тезаурусов должна выглядеть следующим образом.
1. Выбирается общая научно-техническая классификация, представляемая в виде древовидного графа, и аналогичным образом оформленные отраслевые тезаурусы.
2. На основании уже имеющихся лингвистических описаний тезаурусов окончаниям классификационного дерева приписываются наборы КС и КСс, а к узлам привязываются списки ПКС и ПКСс, которые относятся ко всему кусту. Все эти лексические единицы вводятся в списки вместе с их вероятностными или информационными весами, если, разумеется, таковые имеются. Каждому КС, ПКС, КСс и ПКСс приписывается код той ветки или узла, к которым привязана данная лингвистическая единица.
3. Проверяется соответствие кодов КС, ПКС, КСс и ПКСс их значениям и функциям в отраслевых тезаурусах. На основании этой проверки осуществляется первая коррекция общей иерархической классификации.
4. Автоматически обрабатываются научно-технические документы по различным областям знаний, в результате чего для каждого документа формируется ПОД, представляющий собой список КС, ПКС, КСс и ПКСс с их статистическими весами.
5. Каждый ПОД последовательно сравнивается со списками, привязанными к узлам и веткам классификационного дерева. При сравнении учитываются веса лингвистических единиц.
6. В результате автоматического сравнения, осуществленного в п. 5, происходит пополнение и перераспределение списков КС, ПКС, КСс и ПКСс. Одновременно осуществляется вторичная классификация, объединение или разведение узлов и ветвей дерева с соответствующей коррекцией кодов.
7. Производится статистическая обработка дефиниций, по результатам которой происходит третья коррекция иерархической классификации. Одновременно достраивается верхняя часть дерева.
8. Путем исследования совместной встречаемости терминологических слов и словосочетаний в тексте выявляются ассоциативные связи, которые затем вводятся в общее классификационное дерево.
Скачал бесплатные программы на этом сайте. Просто супер. Без вирусов и скорость закачки просто огромная.
Наши курсы английского языка для начинающих научат вас разговаривать уже после двух недель занятий.Изучайте язык вместе с нами.