С вопросами автоматического распознавания смысла тесно связаны приемы машинного свертывания текста. Наиболее простым приемом является автоматическое извлечение из текста тех предложений, которые содержат одно или более ключевых слов или словосочетаний, являющихся «пиками» в распределении смысловой информации текста. Эти предложения, расположенные в порядке их следования, выводятся на печать, образуя квазиреферат текста. Машинный «подалгоритм» квазиреферирования, являясь составной частью общего алгоритма распознавания, подключается к блокам 12 и 14 этого алгоритма.

При всей его простоте этот подход имеет серьезные недостатки, состоящие в том, что предложения в квазиреферат выбираются без всякого учета существующих между ними смысловых связей. В тех случаях, когда критерием извлечения предложения из текста является присутствие в нем хотя бы одного КС или КСс, компрессия текста оказывается очень незначительной. Если же выбирать только те предложения, которые имеют не менее двух или трех доминантных единиц, квазиреферат будет заметно меньше исходного текста, но в нем может оказаться потерянной значительная часть смысловой информации, а образующие его предложения будут слабо связаны по смыслу друг с другом.

Только сейчас хозтовары оптом по самым выгодным ценам. Отличные скидки и бонусы ждут вас прямо сейчас.

Отличные Туники и платья понравились здесь. Цены отличные, качество отменное.

Комментирование закрыто.