Выше уже говорилось, что тезаурус (система и норма языка плюс экстралингвистический «житейский» опыт), использующийся носителем языка при декодировании текста, представляет собой «черный ящик». Устройство и функционирование этого «черного ящика» неодинаково у различных носителей языка: разные носители языка по-разному знают свой родной язык и по-разному будут угадывать текст. Поэтому, чтобы получить для разных языков сопоставимые результаты, необходимо каждый раз использовать угадчика с определенным образом стабилизированным тезаурусом и фиксированной стратегией угадывания.
Не задаваясь пока вопросом, как найти образцового угадчика или как приблизить возможности рядового угадчика к уровню идеального информанта, рассмотрим в общих чертах ход идеального угадывания.
Опираясь на априорную информацию тезауруса и информацию, извлеченную из уже декодированного текста, наш угадчик формирует спектр индуктивных вероятностей эвентуальных продолжений. Поскольку угадчик использует полный тезаурус и применяет наилучшую стратегию угадывания, ранжирование продолжений, опирающееся на индуктивные вероятности, должно совпадать на каждом шаге текста с их ранжированием по статистическим вероятностям. При обобщении результатов угадывания мы получаем либо относительные частоты появления букв в определенных участках текста, либо частости определенных видов угадывания.
Предлагают отличные цены заводчики карликовых пуделей в красноярске – узнайте все подробности сами.
В наше время немного поднялись цены на автомобили в йошкар-оле, но вы можете найти авто подешевле.
Узнайте, какие есть санатории сыктывкара цены на лечение и список всех услуг – на сайте.