Мета: Познайомити зі способами представлення і організації текстів у комп'ютерній пам'яті. Дати загальне уявлення про двійкове кодування текстової інформації.
Хід уроку:
Комп'ютер і текст
У сфері комп'ютерних технологій текстом називають послідовність будь-яких символів. На сьогодні, машини користуються набором таких символів, які містять до 256 знаків. Причому, кожному відповідає свій восьмирозрядный двійковий код. Таким чином, у пам'яті комп'ютера будь-який символ тексту займає 8 біт або 1 байт.
Через це, стає можливим вимірювати обсяг пам'яті, необхідний для зберігання будь-якого текстового документа. 1 біт (двійкова цифра) має два значення, додавання кожного розряду в код подвоює кількість одержуваних комбінацій: 2 біта - чотири варіанти, 3 біти - вісім, 4 біта - шістнадцять і т.д.
Приміром, машинописна сторінка формату А4 містить приблизно 55 рядків. На кожній з них міститься десь 60 символів.
Маючи таку інформацію, ми можемо підрахувати кількість текстової інформації на даній сторінці. Кожний символ - 1 байт інформації, а всього символів - 3300 (60 множимо на 55). Виходить, що на сторінці обсяг інформації в районі 3 Кбайт. Таблиця кодування. Двійкові коди і відповідні їм символи зв'язані таблицею кодування. Усі використовувані на комп’ютері таблиці засновані на американському стандарті ASCII4. Він визначає перші 128 кодів (латинські букви, цифри, знаки тощо). Інші ж 128 використовуються для спеціальних символів і букв національних алфавітів (російський, китайський, арабський). А, оскільки, загальних стандартів для цього не було, виникло багато кодувань, у тому числі і для кирилиці.
Саме тому, іноді можна побачити чийсь текст у вигляді набору «закарлючок». Для того, щоб такі тексти можна було прочитати існують програми-конвертори. Вони заміняють двійковий код кожного символу на код іншого кодування. І, найчастіше, користувач повинен указати, з якого кодування в яке йде перетворення.
Однак уже існують програми, які вміють автоматично визначати кодування вихідного тексту. Отже, таблиця, у якій всім символам машинного алфавіту поставлені відповідні порядкові номери називається таблиця кодування.
Таблиця кодів ASCII. Як уже було сказано, міжнародним стандартом для ПК стала таблиця ASCII (Американський стандартний код для інформаційного обміну).
Але можна зустріти і іншу таблицю - КОИ-8 (Код обміну інформацією), яка використовується в комп'ютерних мережах. Таблиця кодів ASCII поділяється на дві частини. У міжнародній практиці стандартом є лише перша частина таблиці, тобто, символи з номерами від 0 (00000000) до 127 (01111111). Це рядкові і прописні букви латинського алфавіту, цифри, розділові знаки, різного виду дужки, комерційні та інші символи. Нумерацію символів від 0 до 31 прийнято називати керуючими. Вони управляють процесом виводу тексту на екран або друку, подачею звукового сигналу на акустичні колонки, розміткою тексту тощо.
Символ 32 – це пробіл або порожня позиція в тексті. Особливу увагу слід приділити на те, що в таблиці кодування букви (прописні і рядкові) розташовуються за абеткою, а цифри впорядковані по зростанню значень. Таке дотримання лексикографічного порядку в розташуванні символів називається принципом послідовного кодування алфавіту.
Друга половина таблиці ASCII називається кодовою сторінкою. Це інші 128 кодів - від 10000000 і до 11111111 – вони мають різні варіанти і кожний (!) варіант має свій номер. У першу чергу, кодова сторінка використовується для розміщення національних алфавітів, відмінних від латинського. В українських національних кодуваннях у цій частині таблиці розміщаються символи українського алфавіту. Отже, для кожної мови окремо.
Кодування Unicode.
Це 16-розрядне кодування - у ній на кожний символ приділяється по 2 байта пам'яті. Відповідно, збільшується обсяг займаної пам'яті в 2 рази. Але така кодова таблиця вміщує до 65536 символів.
Повна версія Unicode містить у собі всі існуючі і вимерлі алфавіти світу і безліч математичних, музичних, хімічних символів.
Програми для роботи з текстом. Прагнення спростити роботу з текстом призвело до створення безлічі програм, спеціально створених для цього - текстових редакторів. Це не просто замінник друкарської машинки, а універсальний засіб для роботи з текстами.
Вони надають широкі можливості маніпулювання текстовими документами. У таких програмах можна працювати не тільки з окремими символами, але й зі словами, рядками, абзацами, графічними фрагментами. Також для них звичні такі операцій як набір тексту, його копіювання, збереження, переміщення, видалення фрагментів, зміна шрифту, кольору й розміру, відправлення на диск і друк. Текст, з яким працює людина, представляється у текстовому редакторі у вигляді аркушів паперу заданого формату, які можна прокручувати на екрані.
Відео. Таблиця кодування Unicode.
Переваги файлового зберігання текстів: 1) економія паперу 2) компактне розміщення 3) можливість миттєвого копіювання на інші носії 4) можливість передачі тексту по лініях мережі або Інтернету
Самоконтроль: 1. Що таке таблиця кодування? 2. Яке кодування стало міжнародним стандартом? 3. Що називається текстовим редактором?
Список використаної літератури:
1. Урок на тему: «Текст і комп’ютерна пам’ять», Жук С.С., м. Черкаси 2. Глушаков С.В., Сурядный А.С., Хагиров Т.С. Курс ПК.- М.: АСТ, 2008 г.
3. Голышева А.В., Ерофеева А.А. «Word без воды» С-П.: Наука и техника, 2008 г.
4. Симонович С.В. Эффективная работа: MS Word 2007. – СПб.: Питер, 2008 г.
5. macedu.narod.ru
Скомпоновано та надіслано викладачем Київського національного університету імені Тараса Шевченка Соловйовим М. С.
----
Над уроком працювали
Жук С.С.
Соловйов М. С.
Поставить вопрос о современном образовании, выразить идею или решить назревшую проблему Вы можете на Образовательном форуме, где на международном уровне собирается образовательный совет свежей мысли и действия. Создав блог, Вы не только повысите свой статус, как компетентного преподавателя, а и сделаете весомый вклад в развитие школы будущего. Гильдия Лидеров Образования открывает двери для специалистов высшего ранга и приглашает к сотрудничеству в направлении создания лучших в мире школ.