KNOWLEDGE HYPERMARKET


Kодирование текстовой информации. Полные уроки
Строка 1: Строка 1:
-
'''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]>>[[Информатика]]>>[[Информатика 10 класс. Полные уроки]]>>Информатика: Kодирование текстовой информации.'''
+
<p><b><a href="Гипермаркет знаний - первый в мире!">Гипермаркет знаний</a>&gt;&gt;<a _fcknotitle="true" href="Информатика">Информатика</a>&gt;&gt;<a _fcknotitle="true" href="Информатика 10 класс. Полные уроки">Информатика 10 класс. Полные уроки</a>&gt;&gt;Информатика: Kодирование текстовой информации.</b>
-
 
+
</p><p><span class="fck_mw_special" _fck_mw_customtag="true" _fck_mw_tagname="metakeywords">Информатика, класс, урок, на тему, 10 класс, Kодирование текстовой информации.</span><br />  
-
<metakeywords>Информатика, класс, урок, на тему, 10 класс, Kодирование текстовой информации.</metakeywords><br>  
+
</p><p><b>Тема: Kодирование текстовой информации. </b>
-
 
+
</p><p><b>Цель: </b>Познакомить с методами кодирования текстов в памяти компьютера.  
-
'''Тема: Kодирование текстовой информации. '''
+
</p><p>В компьютерной области текстом называют последовательность любых символов. На сегодня, машины пользуются набором таких символов, содержащих до 256 знаков.<br />Причем, каждому соответствует свой восьмиразрядный двоичный код. Таким образом, в памяти компьютера любой символ текста занимает 8 бит или 1 байт.  
-
 
+
</p><p>Имея это ввиду, представляется возможным измерять объем памяти, необходимый для хранения любого текстового документа.<br />1 бит (двоичная цифра) имеет два значения, добавление каждого разряда в код удваивает количество получаемых комбинаций: 2 бита - четыре варианта, 3 бита - восемь, 4 бита - шестнадцать и т. д.  
-
'''Цель: '''Познакомить с методами кодирования текстов в памяти компьютера.  
+
</p><p><span class="fck_mw_template">{{#ev:youtube| et0DOEdymys }}</span><br />К примеру, машинописная страница формата А4 содержит приблизительно 55 строк. На каждой из них помещается где-то 60 символов.  
-
 
+
</p><p>Имея такую информацию, мы можем подсчитать количество текстовой информации на данной странице.<br />Каждый символ - 1 байт информации, а всего символов - 3300 (60 умножаем на 55). Выходит, что на странице объем информации в районе 3 Кбайт.<br /><span class="fck_mw_template">{{#ev:youtube| 42WhVRpPr50&amp;amp;feature=related }}</span><br /><b>Таблица кодировки.</b><br />Двоичные коды и соответствующие им символы связаны таблицей кодировки. Все используемые на ПК таблицы основаны на американском стандарте ASCII4. Он определяет первые 128 кодов (латинские буквы, цифры, знаки). Остальные же 128 используются для спецсимволов и букв национальных алфавитов (русский, китайский, арабский). А, поскольку, общих стандартов для этого не было, возникло много кодировок, в том числе и для кириллицы. <img src="/images/4/49/33334.jpg" _fck_mw_filename="33334.jpg" alt="" /> <br />  
-
В компьютерной области текстом называют последовательность любых символов. На сегодня, машины пользуются набором таких символов, содержащих до 256 знаков.<br>Причем, каждому соответствует свой восьмиразрядный двоичный код. Таким образом, в памяти компьютера любой символ текста занимает 8 бит или 1 байт.  
+
</p><p>Именно поэтому, иногда можно увидеть чей-то текст в виде набора «закорючек».<br />Для того, чтобы такие тексты можно было прочитать существуют программы-конверторы.&nbsp; Они заменяют двоичный код каждого символа на код другой кодировки. И, зачастую, пользователь должен указать, из какой в какую кодировки идет преобразование.  
-
 
+
</p><p>&nbsp; <img src="/images/e/e4/%D0%9A%D0%BE%D0%B4ple.jpg" _fck_mw_filename="Кодple.jpg" alt="" />
-
Имея это ввиду, представляется возможным измерять объем памяти, необходимый для хранения любого текстового документа.<br>1 бит (двоичная цифра) имеет два значения, добавление каждого разряда в код удваивает количество получаемых комбинаций: 2 бита - четыре варианта, 3 бита - восемь, 4 бита - шестнадцать и т. д.  
+
</p><p>Однако уже существуют программы, умеющие автоматически определять кодировку исходного текста.<br />Итак, таблица, в которой всем символам машинного алфавита поставлены соответственные порядковые номера называется <b>таблица кодировки.</b>
-
 
+
</p><p><br /><b>Таблица кодов ASCII.</b><br />Как уже было сказано, международным стандартом для ПК стала таблица ASCII (Американский стандартный код для информационного обмена).  
-
{{#ev:youtube| et0DOEdymys }}<br>К примеру, машинописная страница формата А4 содержит приблизительно 55 строк. На каждой из них помещается где-то 60 символов.  
+
</p><p>Также можно встретить и другую таблицу - КОИ-8 (Код обмена информацией),&nbsp; использующаяся в компьютерных сетях.&nbsp; <br />Таблица кодов ASCII делится на <i>две части</i>. <br />В международной практике стандартом является лишь <i>первая часть таблицы</i>, то есть, символы с номерами от 0 (00000000), до 127 (01111111). Это строчные и прописные буквы латинского алфавита, цифры, знаки препинания, разного вида скобки, коммерческие и другие символы.<br />Нумерацию символов от 0 до 31 принято называть управляющими. Они управляют процессом вывода текста на экран или печать, подачей звукового сигнала на акустические колонки, разметкой текста.<br /> Символ 32 – это пробел или пустая позиция в тексте. <br />Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом&nbsp; последовательного кодирования алфавита.  
-
 
+
</p><p><br />  
-
Имея такую информацию, мы можем подсчитать количество текстовой информации на данной странице.<br>Каждый символ - 1 байт информации, а всего символов - 3300 (60 умножаем на 55). Выходит, что на странице объем информации в районе 3 Кбайт.<br>{{#ev:youtube| 42WhVRpPr50&amp;feature=related }}<br>'''Таблица кодировки.'''<br>Двоичные коды и соответствующие им символы связаны таблицей кодировки. Все используемые на ПК таблицы основаны на американском стандарте ASCII4. Он определяет первые 128 кодов (латинские буквы, цифры, знаки). Остальные же 128 используются для спецсимволов и букв национальных алфавитов (русский, китайский, арабский). А, поскольку, общих стандартов для этого не было, возникло много кодировок, в том числе и для кириллицы. [[Image:33334.jpg]] <br>  
+
</p><p><img src="/images/4/4b/%D0%90%D1%81%D1%86%D0%B8%D0%B8.jpg" _fck_mw_filename="Асции.jpg" alt="" />
-
 
+
</p><p><br />  
-
Именно поэтому, иногда можно увидеть чей-то текст в виде набора «закорючек».<br>Для того, чтобы такие тексты можно было прочитать существуют программы-конверторы.&nbsp; Они заменяют двоичный код каждого символа на код другой кодировки. И, зачастую, пользователь должен указать, из какой в какую кодировки идет преобразование.  
+
</p><p><br />  
-
 
+
</p><p><i>Вторая половина</i> таблицы ASCII называемая кодовой страницей. Это остальные 128 кодов от 10000000 и до 11111111, имеющие различные варианты, и каждый (!) вариант имеет свой номер. <br />В первую очередь, кодовая страница используется для размещения национальных алфавитов, отличительных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. Итак для каждого языка отдельно.  
-
&nbsp; [[Image:Кодple.jpg]]
+
</p><p><br />  
-
 
+
</p><p><b>Кодировка Unicode.</b>
-
Однако уже существуют программы, умеющие автоматически определять кодировку исходного текста.<br>Итак, таблица, в которой всем символам машинного алфавита поставлены соответственные порядковые номера называется '''таблица кодировки.'''
+
</p><p><br />  
-
 
+
</p><p>Это 16-разрядная кодировка - в ней на каждый символ отводится по 2 байта памяти.<br />Соответственно, увеличивается объем занимаемой памяти в 2 раза. Но зато такая кодовая таблица вмещает до 65536 символов.  
-
<br>'''Таблица кодов ASCII.'''<br>Как уже было сказано, международным стандартом для ПК стала таблица ASCII (Американский стандартный код для информационного обмена).  
+
</p><p>Полная версия Unicode включает в себя все существующие и вымершие алфавиты мира и множество математических, музыкальных, химических символов.<br /><br /><b>Программы для работы с текстом.</b><br />Стремление упростить работу с текстом привело к созданию множества программ, специально созданных для этого - текстовых редакторов.<br />Текстовый процессор не просто заменитель пишущей машинки, а универсальное средство для работы с текстами.  
-
 
+
</p><p>Они предоставляет очень широкие возможности манипулирования текстовыми документами.<br />В таких программах можно работать не только с отдельными символами, но и со <i>словами, строками, абзацами, графическими фрагментами</i>. Кроме таких операций как набор текста, копирование, сохранение, перемещение и удаление фрагментов, изменение шрифта, цвета и размера, отправление текста на диск и печать.<br />Обрабатываемый текст представляется как бы в виде листков бумаги заданного формата, прокручивающихся на экране.<br /><span class="fck_mw_template">{{#ev:youtube| JnY2P_DsQDs }}</span><br /><b>Преимущества файлового хранения текстов:</b><br />1)&nbsp;&nbsp;&nbsp; экономия бумаги<br />2)&nbsp;&nbsp;&nbsp; компактное размещение<br />3)&nbsp;&nbsp;&nbsp; возможность мгновенного копирования на другие носители<br />4)&nbsp;&nbsp;&nbsp; возможность передачи текста по линиям сети или Интернета<br /><br /><b>Вопросы:</b><br />1. Что такое таблица кодировки?<br />2. Какая кодировка стала международным стандартом?<br />3. Что называется текстовым редактором?<br /><br /><b>Список использованных источников:</b>
-
Также можно встретить и другую таблицу - КОИ-8 (Код обмена информацией),&nbsp; использующаяся в компьютерных сетях.&nbsp; <br>Таблица кодов ASCII делится на ''две части''. <br>В международной практике стандартом является лишь ''первая часть таблицы'', то есть, символы с номерами от 0 (00000000), до 127 (01111111). Это строчные и прописные буквы латинского алфавита, цифры, знаки препинания, разного вида скобки, коммерческие и другие символы.<br>Нумерацию символов от 0 до 31 принято называть управляющими. Они управляют процессом вывода текста на экран или печать, подачей звукового сигнала на акустические колонки, разметкой текста.<br> Символ 32 – это пробел или пустая позиция в тексте. <br>Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом&nbsp; последовательного кодирования алфавита.  
+
</p><p>1. Урок на тему: «Процесс кодирования текста», Павлов М. С., г. Черкассы<br />2. Еремин Е.А. Как работает буфер клавиатуры / Информатика № 45, 2004 г.<br />3. Семакин И.Г. Информатика. Базовый курс. 7-9 классы / И.Г. Семакин, А.Л. Залогова, С.В. Русаков, Л.В. Шестакова. 2-е изд., испр. и доп. М.: БИНОМ, 2004 г.<br /><br />
-
 
+
</p><p><br /><i>Отредактировано и выслано преподавателем Киевского национального университета им. Тараса Шевченка Соловьевым М. С.</i><br /><br />
-
<br>  
+
</p><p>Отредактировано и выслано преподавателем Киевского национального университета им. Тараса Шевченко Соловьевым М. С.
-
 
+
</p><p>Если у вас есть исправления или предложения к данному уроку, <a href="http://xvatit.com/index.php?do=feedback">напишите нам</a>.  
-
[[Image:Асции.jpg]]
+
</p><p>Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - <a href="http://xvatit.com/forum/">Образовательный форум</a>.
-
 
+
</p><a _fcknotitle="true" href="Category:Информатика_10_класс">Информатика_10_класс</a>
-
<br>  
+
-
 
+
-
<br>  
+
-
 
+
-
''Вторая половина'' таблицы ASCII называемая кодовой страницей. Это остальные 128 кодов от 10000000 и до 11111111, имеющие различные варианты, и каждый (!) вариант имеет свой номер. <br>В первую очередь, кодовая страница используется для размещения национальных алфавитов, отличительных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. Итак для каждого языка отдельно.  
+
-
 
+
-
<br>  
+
-
 
+
-
'''Кодировка Unicode.'''
+
-
 
+
-
<br>  
+
-
 
+
-
Это 16-разрядная кодировка - в ней на каждый символ отводится по 2 байта памяти.<br>Соответственно, увеличивается объем занимаемой памяти в 2 раза. Но зато такая кодовая таблица вмещает до 65536 символов.  
+
-
 
+
-
Полная версия Unicode включает в себя все существующие и вымершие алфавиты мира и множество математических, музыкальных, химических символов.<br><br>'''Программы для работы с текстом.'''<br>Стремление упростить работу с текстом привело к созданию множества программ, специально созданных для этого - текстовых редакторов.<br>Текстовый процессор не просто заменитель пишущей машинки, а универсальное средство для работы с текстами.  
+
-
 
+
-
Они предоставляет очень широкие возможности манипулирования текстовыми документами.<br>В таких программах можно работать не только с отдельными символами, но и со ''словами, строками, абзацами, графическими фрагментами''. Кроме таких операций как набор текста, копирование, сохранение, перемещение и удаление фрагментов, изменение шрифта, цвета и размера, отправление текста на диск и печать.<br>Обрабатываемый текст представляется как бы в виде листков бумаги заданного формата, прокручивающихся на экране.<br>{{#ev:youtube| JnY2P_DsQDs }}<br>'''Преимущества файлового хранения текстов:'''<br>1)&nbsp;&nbsp;&nbsp; экономия бумаги<br>2)&nbsp;&nbsp;&nbsp; компактное размещение<br>3)&nbsp;&nbsp;&nbsp; возможность мгновенного копирования на другие носители<br>4)&nbsp;&nbsp;&nbsp; возможность передачи текста по линиям сети или Интернета<br><br>'''Вопросы:'''<br>1. Что такое таблица кодировки?<br>2. Какая кодировка стала международным стандартом?<br>3. Что называется текстовым редактором?<br><br>'''Список использованных источников:'''
+
-
 
+
-
1. Урок на тему: «Процесс кодирования текста», Павлов М. С., г. Черкассы<br>2. Еремин Е.А. Как работает буфер клавиатуры / Информатика № 45, 2004 г.<br>3. Семакин И.Г. Информатика. Базовый курс. 7-9 классы / И.Г. Семакин, А.Л. Залогова, С.В. Русаков, Л.В. Шестакова. 2-е изд., испр. и доп. М.: БИНОМ, 2004 г.<br><br>
+
-
 
+
-
<br>''Отредактировано и выслано преподавателем Киевского национального университета им. Тараса Шевченка Соловьевым М. С.''<br><br>
+
-
 
+
-
Отредактировано и выслано преподавателем Киевского национального университета им. Тараса Шевченка Соловьевым М. С.
+
-
 
+
-
Если у вас есть исправления или предложения к данному уроку, [http://xvatit.com/index.php?do=feedback напишите нам].  
+
-
 
+
-
Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - [http://xvatit.com/forum/ Образовательный форум].  
+
-
 
+
-
[[Category:Информатика_10_класс]]
+

Версия 15:21, 22 ноября 2010

<a href="Гипермаркет знаний - первый в мире!">Гипермаркет знаний</a>>><a _fcknotitle="true" href="Информатика">Информатика</a>>><a _fcknotitle="true" href="Информатика 10 класс. Полные уроки">Информатика 10 класс. Полные уроки</a>>>Информатика: Kодирование текстовой информации.

Информатика, класс, урок, на тему, 10 класс, Kодирование текстовой информации.

Тема: Kодирование текстовой информации.

Цель: Познакомить с методами кодирования текстов в памяти компьютера.

В компьютерной области текстом называют последовательность любых символов. На сегодня, машины пользуются набором таких символов, содержащих до 256 знаков.
Причем, каждому соответствует свой восьмиразрядный двоичный код. Таким образом, в памяти компьютера любой символ текста занимает 8 бит или 1 байт.

Имея это ввиду, представляется возможным измерять объем памяти, необходимый для хранения любого текстового документа.
1 бит (двоичная цифра) имеет два значения, добавление каждого разряда в код удваивает количество получаемых комбинаций: 2 бита - четыре варианта, 3 бита - восемь, 4 бита - шестнадцать и т. д.


К примеру, машинописная страница формата А4 содержит приблизительно 55 строк. На каждой из них помещается где-то 60 символов.

Имея такую информацию, мы можем подсчитать количество текстовой информации на данной странице.
Каждый символ - 1 байт информации, а всего символов - 3300 (60 умножаем на 55). Выходит, что на странице объем информации в районе 3 Кбайт.

Таблица кодировки.
Двоичные коды и соответствующие им символы связаны таблицей кодировки. Все используемые на ПК таблицы основаны на американском стандарте ASCII4. Он определяет первые 128 кодов (латинские буквы, цифры, знаки). Остальные же 128 используются для спецсимволов и букв национальных алфавитов (русский, китайский, арабский). А, поскольку, общих стандартов для этого не было, возникло много кодировок, в том числе и для кириллицы. <img src="/images/4/49/33334.jpg" _fck_mw_filename="33334.jpg" alt="" />

Именно поэтому, иногда можно увидеть чей-то текст в виде набора «закорючек».
Для того, чтобы такие тексты можно было прочитать существуют программы-конверторы.  Они заменяют двоичный код каждого символа на код другой кодировки. И, зачастую, пользователь должен указать, из какой в какую кодировки идет преобразование.

  <img src="/images/e/e4/%D0%9A%D0%BE%D0%B4ple.jpg" _fck_mw_filename="Кодple.jpg" alt="" />

Однако уже существуют программы, умеющие автоматически определять кодировку исходного текста.
Итак, таблица, в которой всем символам машинного алфавита поставлены соответственные порядковые номера называется таблица кодировки.


Таблица кодов ASCII.
Как уже было сказано, международным стандартом для ПК стала таблица ASCII (Американский стандартный код для информационного обмена).

Также можно встретить и другую таблицу - КОИ-8 (Код обмена информацией),  использующаяся в компьютерных сетях. 
Таблица кодов ASCII делится на две части.
В международной практике стандартом является лишь первая часть таблицы, то есть, символы с номерами от 0 (00000000), до 127 (01111111). Это строчные и прописные буквы латинского алфавита, цифры, знаки препинания, разного вида скобки, коммерческие и другие символы.
Нумерацию символов от 0 до 31 принято называть управляющими. Они управляют процессом вывода текста на экран или печать, подачей звукового сигнала на акустические колонки, разметкой текста.
Символ 32 – это пробел или пустая позиция в тексте.
Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом  последовательного кодирования алфавита.


<img src="/images/4/4b/%D0%90%D1%81%D1%86%D0%B8%D0%B8.jpg" _fck_mw_filename="Асции.jpg" alt="" />



Вторая половина таблицы ASCII называемая кодовой страницей. Это остальные 128 кодов от 10000000 и до 11111111, имеющие различные варианты, и каждый (!) вариант имеет свой номер.
В первую очередь, кодовая страница используется для размещения национальных алфавитов, отличительных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. Итак для каждого языка отдельно.


Кодировка Unicode.


Это 16-разрядная кодировка - в ней на каждый символ отводится по 2 байта памяти.
Соответственно, увеличивается объем занимаемой памяти в 2 раза. Но зато такая кодовая таблица вмещает до 65536 символов.

Полная версия Unicode включает в себя все существующие и вымершие алфавиты мира и множество математических, музыкальных, химических символов.

Программы для работы с текстом.
Стремление упростить работу с текстом привело к созданию множества программ, специально созданных для этого - текстовых редакторов.
Текстовый процессор не просто заменитель пишущей машинки, а универсальное средство для работы с текстами.

Они предоставляет очень широкие возможности манипулирования текстовыми документами.
В таких программах можно работать не только с отдельными символами, но и со словами, строками, абзацами, графическими фрагментами. Кроме таких операций как набор текста, копирование, сохранение, перемещение и удаление фрагментов, изменение шрифта, цвета и размера, отправление текста на диск и печать.
Обрабатываемый текст представляется как бы в виде листков бумаги заданного формата, прокручивающихся на экране.

Преимущества файлового хранения текстов:
1)    экономия бумаги
2)    компактное размещение
3)    возможность мгновенного копирования на другие носители
4)    возможность передачи текста по линиям сети или Интернета

Вопросы:
1. Что такое таблица кодировки?
2. Какая кодировка стала международным стандартом?
3. Что называется текстовым редактором?

Список использованных источников:

1. Урок на тему: «Процесс кодирования текста», Павлов М. С., г. Черкассы
2. Еремин Е.А. Как работает буфер клавиатуры / Информатика № 45, 2004 г.
3. Семакин И.Г. Информатика. Базовый курс. 7-9 классы / И.Г. Семакин, А.Л. Залогова, С.В. Русаков, Л.В. Шестакова. 2-е изд., испр. и доп. М.: БИНОМ, 2004 г.


Отредактировано и выслано преподавателем Киевского национального университета им. Тараса Шевченка Соловьевым М. С.

Отредактировано и выслано преподавателем Киевского национального университета им. Тараса Шевченко Соловьевым М. С.

Если у вас есть исправления или предложения к данному уроку, <a href="http://xvatit.com/index.php?do=feedback">напишите нам</a>.

Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - <a href="http://xvatit.com/forum/">Образовательный форум</a>.

<a _fcknotitle="true" href="Category:Информатика_10_класс">Информатика_10_класс</a>