Дискретні моделі даних в комп’ютері

У цьому параграфі обговоримо способи комп’ютерного кодування текстової, графічної та звукової інформації. З текстової та графічної інформацією конструктори ЕОМ «навчили» працювати машини, починаючи з третього покоління (1970-ті роки). А роботу зі звуком «освоїли» лише машини четвертого покоління, сучасні персональні комп’ютери. З цього моменту почалося поширення технології мультимедіа.
Що принципово нового з’являлося в пристрої комп’ютерів з освоєнням ними нових видів інформації? Головним чином, це периферійні пристрої для введення і виведення текстів, графіки, відео, звуку. Процесор ж і оперативна пам’ять за своїми функціями змінилися мало. Істотно зросла їх швидкодія, обсяг пам’яті. Але, як це було на перших поколіннях ЕОМ, так і залишилося на сучасних ПК – основним навиком процесора в обробці даних є вміння виконувати обчислення з двійковими числами. Обробка тексту, графіки і звуку являє собою теж обробку числових даних. Якщо сказати ще точніше – то це обробка цілих чисел. З цієї причини комп’ютерні технології називають цифровими технологіями.
Про те, як тексти, графіка і звук зводяться до цілих числах, буде розказано далі. Попередньо відзначимо, що тут ми знову зустрінемося з головною формулою інформатики:
2i = N.
Сенс входять до неї величин тут наступний: i – розрядність комірки пам’яті (в бітах), N – кількість різних цілих позитивних чисел, які можна записати в цей осередок.
Текстова інформація
Принципово важливо, що текстова інформація вже дискретна – складається з окремих знаків. Тому виникає лише технічне питання, як розмістити її в пам’яті комп’ютера.
Нагадаємо про байтовому принципі організації пам’яті комп’ютерів, що обговорювався в базовому курсі інформатики. Повернемося до рис. 4.7. Кожна клітинка на ньому позначає біт пам’яті. Вісім підряд розташованих бітів утворюють байт пам’яті. Байти пронумеровані. Порядковий номер байта визначає його адресу в пам’яті комп’ютера. Саме за адресами процесор звертається до даних, читаючи або записуючи їх у пам’ять (рис. 4.12).

Модель представлення тексту в пам’яті вельми проста. За кожною буквою алфавіту, цифр, розділових знаків і іншим загальноприйнятим при записі тексту символом закріплюється певний двійковий код, довжина якого фіксована. У популярних системах кодування (ASCII, KOI8 та ін.) Кожен символ замінюється на 8-розрядне ціле позитивне двійкове число; воно зберігається в одному байті пам’яті. Це число є порядковим номером символу в кодової таблиці. Згідно головною формулою інформатики, визначаємо, що розмір алфавіту, який можна закодувати, дорівнює: 28 = 256. Цієї кількості цілком достатньо для розміщення двох алфавітів природних мов (англійської та російської) і всіх необхідних додаткових символів.
Оскільки у світі багато мов і багато алфавітів, то поступово відбувається перехід на міжнародну 16-бітову систему кодування Unicode. У ній кожен символ займає 2 байта, що забезпечує 216 = 65536 кодів для різних символів.
При роботі з електронною поштою поштова програма іноді нас запитує, чи не хочемо ми вдатися до кодуванні Unicode для повідомлень, що пересилаються. Таким способом можна уникнути проблеми невідповідності кодувань, через яку іноді не вдається прочитати російський текст.
Не слід уявляти собі текст, що зберігається в пам’яті комп’ютера або на зовнішньому носії, лише як потік байтів, кожен з яких є лише кодом символу тексту. Формати зберігання текстової інформації визначаються форматами текстових файлів, використовуваних тією чи іншою програмою обробки текстів. Файли, що створюються за допомогою текстових процесорів (наприклад, Microsoft Word), включають в себе не тільки коди символів алфавіту, але й дані формату: тип і розмір шрифту, положення рядків, поля і відступи та іншу додаткову інформацію.
Графічна інформація
З базового курсу інформатики ви знайомі з загальними принципами комп’ютерної графіки, з графічними технологіями. Тут ми трохи докладніше, ніж це робилося раніше, розглянемо способи представлення графічних зображень в пам’яті комп’ютера.
Принцип дискретності комп’ютерних даних справедливий і для графіки. Тут можна говорити про дискретно поданні зображення (малюнка, фотографії, відеокадрів) і дискретності кольору.
Дискретне представлення зображення. Зображення на екрані монітора дискретно. Воно складається з окремих точок, які називаються пікселями (picture elements – елементи малюнка). Це пов’язано з технічними особливостями пристрою екрану, незалежно від його фізичної реалізації, будь то традиційний дисплей на електронно-променевої трубці, рідкокристалічний або плазмовий. Ці «точки» настільки близькі один одному, що око не розрізняє проміжків між ними, тому зображення сприймається як безперервне, суцільне. Якщо виведене з комп’ютера зображення формується на папері (принтером або плоттером), то лінії на ньому також виглядають безперервними. Проте в основі все одно лежить печать близьких один до одного точок.
Залежно від того, на який графічний дозвіл екрана налаштована операційна система комп’ютера, на екрані можуть розміщуватися зображення, що мають розмір 640×480, 800×600, 1024×768 і більше пікселів. Така прямокутна матриця пікселів на екрані комп’ютера називається растром.
Якість зображення залежить не тільки від розміру растра, а й від розміру екрана монітора, який зазвичай характеризується довжиною діагоналі. Існує параметр дозволу екрану. Цей параметр вимірюється в точках на дюйм (по-англійськи dots per inch – dpi). У монітора з діагоналлю 15 дюймів розмір зображення на екрані складає приблизно 28×21 см. Знаючи, що в одному дюймі 25,4 мм, можна розрахувати, що при роботі монітора в режимі 800×600 пікселів дозвіл екранного зображення дорівнює 72 dpi.
При друку на папері дозвіл має бути набагато вище. Поліграфічний друк повноколірного зображення вимагає дозволу 200-300 dpi. Стандартний фотознімок розміром 10×15 см повинен містити приблизно 1000×1500 пікселів.
Дискретне уявлення кольору. Відновимо ваші знання про кодування кольору, отримані з базового курсу інформатики. Основне правило звучить так: будь-який колір точки на екрані комп’ютера виходить шляхом змішування трьох базових кольорів: червоного, зеленого, синього. Цей принцип називається колірною моделлю RGB (Red, Green, Blue).
Двійковий код кольору визначає, в якому співвідношенні перебувають інтенсивності трьох базових кольорів. Якщо всі вони змішуються в однакових частках, то в підсумку виходить білий колір. Якщо всі три компоненти «вимкнені», то колір пікселя – чорний. Всі інші кольори лежать між білим і чорним.

Посилання на основну публікацію