1. Моя освіта – реферати, конспекти, доповіді
  2. Інформатика
  3. Алфавітний підхід виміру інформації

Алфавітний підхід виміру інформації

Алфавіт – безліч використовуваних символів в мові. Зазвичай під алфавітом розуміють не тільки букви, але й цифри, розділові знаки і пробіл.

Потужність алфавіту (N) – кількість символів, що використовуються в алфавіті. Наприклад, потужність алфавіту з російських букв дорівнює 33.

Припустимо, що кожен символ може з’являтися з однаковою ймовірністю.

Тоді кожен такий символ несе i біт інформації, які можна визначити з рівняння: N = 2 ‘.

Щоб знайти кількість інформації (V) у всьому тексті, потрібно порахувати кількість символів у ньому (к) і помножити на i: V = k * i.

При алфавітному підході до вимірювання інформації інформаційний обсяг тексту залежить тільки від розміру тексту і від потужності алфавіту, а не від змісту. Тому не можна порівнювати інформаційні обсяги текстів, написаних на різних мовах, за розміром тексту.

ПОДІЛИТИСЯ: