Теория информации оперирует с математическими моделями. Рассматривает носители информации как элементы абстрактного (математического) множества, а взаимодействия между носителями как способ расположения элементов в этом множестве. Такой подход дает возможность формально описать код информации, то есть определить абстрактный код и исследовать его математическими методами. Для этих исследований применяет методы теории вероятностей, математической статистики, линейной алгебры, теории игр и других математических теорий.
Основные разделы теории информации — кодирование источника (сжимающее или экономное кодирование) и канальное (помехоустойчивое) кодирование. Кодированием называется процесс преобразования сообщения в комбинацию символов в соответствии с кодом. Процесс восстановления сообщения из комбинации символов называется декодированием.
Для перевода информации в формальный, цифровой вид используются специальные таблицы, сопоставляющие кодируемым сущностям их коды и называемые таблицами кодировки (кодовыми страницами, character set). Такой процесс сопоставления называют примитивным кодированием.
Для русского языка имеется несколько разных таблиц кодировки символов кириллицы: KOI8-R, IBM-866, CP-1251, ISO-8551-5, все они одинаково изображают символы первой половины таблицы (от 0 до 127) и различаются представлением символов русского алфавита и псевдографики. Кодировки символов не определяют изображения символов, а только состав набора символов и способ его представления в компьютере. Кроме того очень важен порядок перечисления символов в наборе, так как он влияет самым существенным образом на алгоритмы сортировки.
Бит (англ. binary digit; также игра слов: англ. bit — немного) — один двоичный разряд в двоичной системе счисления.