Субъективизм этих подходов пытаются иногда корректировать методом экспертных оценок. Однако этот прием оказывается слишком громоздким и недостаточно эффективным. Поэтому более целесообразным является введение таких приемов остранения, которые опираются на массовые психолингвистические тесты, а также на методы лингвистики текста. Среди них наиболее перспективными являются следующие приемы.
Использование данных частотных словарей и информационных измерений семантики. Основная идея статистического подхода состоит в том, что наиболее часто используемые термины должны быть отнесены к более высоким ярусам классификации, а более редкие термины следует помещать на нижних уровнях графа.
Как показывает опыт группы «Статистика речи», наибольший эффект можно получить, используя многоступенчатый прием статистической корректировки тезауруса. По выборке текстов, представляющих определенное СП, автоматически составляется частотный словарь. Из ЧС извлекаются термины, каждый из которых снабжается научно-техническим определением. Оно может быть заимствовано из отраслевых толковых или энциклопедических словарей, учебников или составлено специалистом в данной области знаний. При этом предполагается, что дефиниции включают родовой термин, а также один или несколько видовых спецификаторов. Поэтому каждую дефиницию можно рассматривать как имплицитную ветку тезауруса, описывающую родовидовые отношения.
Отныне вы можете без особых усилийскачать бесплатно нужную вам софтину.