рефераты

рефераты

 
 
рефераты рефераты

Меню

Реферат: Язык С рефераты

программы. Содержимое S сильно зависит от используемой опе-

рационной системы. В качестве тривиального примера, укажем,

что на системе UNIX строка

 

SYSTEM(“DATE”);

приводит к выполнению программы DATE, которая печатает дату

и время дня.

 

7.9.4.                Управление памятью

Функция CALLOC весьма сходна с функцией ALLOC, использо-

ванной нами в предыдущих главах. В результате обращения

CALLOC(N, SIZEOF(OBJCCT))

возвращается либо указатель пространства, достаточного для

размещения N объектов указанного размера, либо NULL, если

запрос не может быть удволетворен. Отводимая память инициа-

лизируется нулевыми значениями.

Указатель обладает нужным для рассматриваемых объектов

выравниванием, но ему следует приписывать соответствующий

тип, как в

 

CHAR *CALLOC();

INT *IP;

IP=(INT*) CALLOC(N,SIZEOF(INT));

Функция CFREE(P) освобождает пространство, на которое

указывает “P”, причем указатель “P” певоначально должен быть

получен в результате обращения к CALLOC. Здесь нет никаких

ограничений на порядок освобождения пространства, но будет

неприятнейшей ошибкой освободить что-нибудь, что не было по-

лучено обращением к CALLOC.

Реализация программы распределения памяти, подобной

CALLOC, в которой размещенные блоки могут освобождаться в

произвольном порядке, продемонстрирована в главе 8.

·     167 -

    

8.   Интерфейс системы UNIX

Материал этой главы относится к интерфейсу между с-прог-

раммами и операционной системой UNIX. Так как большинство

пользователей языка “C” работают на системе UNIX, эта глава

окажется полезной для большинства читателей. даже если вы

используете с-компилятор на другой машине, изучение приводи-

мых здесь примеров должно помочь вам глубже проникнуть в ме-

тоды программирования на языке “C”.

Эта глава делится на три основные части: ввод/вывод,

система файлов и распределение памяти. Первые две части

предполагают небольшое знакомство с внешними характеристика-

ми системы UNIX.

В главе 7 мы имели дело с системным интерфейсом, который

одинаков для всего многообразия операционных систем. На каж-

дой конкретной системе функции стандартной библиотеки должны

быть написаны в терминах ввода-вывода, доступных на данной

машине. В следующих нескольких разделах мы опишем основную

систему связанных с вводом и выводом точек входа операцион-

ной системы UNIX и проиллюстрируем, как с их помощью могут

быть реализованы различные части стандартной библиотеки.

 

8.1.   Дескрипторы файлов

В операционной системе UNIX весь ввод и вывод осуществ-

ляется посредством чтения файлов или их записи, потому что

все периферийные устройства, включая даже терминал пользова-

теля, являются файлами определенной файловой системы. Это

означает, что один однородный интерфейс управляет всеми свя-

зями между программой и периферийными устройствами.

В наиболее общем случае перед чтением из файла или за-

писью в файл необходимо сообщить системе о вашем намерении;

этот процесс называется “открытием” файла. Система выясня-

ет,имеете ли вы право поступать таким образом (существует ли

этот файл? имеется ли у вас разрешение на обращение к не-

му?), и если все в порядке, возвращает в программу небольшое

положительное целое число, называемое дескриптором файла.

всякий раз, когда этот файл используется для ввода или выво-

да, для идентификации файла употребляется дескриптор файла,

а не его имя. (Здесь существует примерная аналогия с исполь-

зованием READ (5,...) и WRITE (6,...) в фортране). Вся ин-

формация об открытом файле содержится в системе; программа

пользователя обращается к файлу только через дескриптор фай-

ла.

Для удобства выполнения обычных операций ввода и вывода

с помощью терминала пользователя существуют специальные сог-

лашения. Когда интерпретатор команд (“SHELL”) прогоняет

программу, он открывает три файла, называемые стандартным

вводом, стандартным выводом и стандартным выводом ошибок,

которые имеют соответственно числа 0, 1 и 2 в качестве деск-

рипторов этих файлов. В нормальном состоянии все они связаны

с терминалом, так что если программа читает с дескриптором

файла 0 и пишет с дескрипторами файлов 1 и 2, то она может

осуществлять ввод и вывод с помощью терминала, не заботясь

об открытии соответствующих файлов.

    

·     168 -

    

Пользователь программы может перенаправлять ввод и вывод

на файлы, используя операции командного интерпретатора SHELL

“<” и “>” :

PROG <INFILE>OUTFILE

В этом случае интерпретатор команд SHELL изменит присваива-

ние по умолчанию дескрипторов файлов 0 и 1 с терминала на

указанные файлы. Нормально дескриптор файла 2 остается свя-

занным с терминалом, так что сообщения об ошибках могут пос-

тупать туда. Подобные замечания справедливы и тогда, когда

ввод и вывод связан с каналом. Следует отметить, что во всех

случаях прикрепления файлов изменяются интерпретатором

SHELL, а не программой. Сама программа, пока она использует

файл 0 для ввода и файлы 1 и 2 для вывода, не знает ни отку-

да приходит ее ввод, ни куда поступает ее выдача.

    

8.2.   Низкоуровневый ввод/вывод - операторы READ и WRITE.

Самый низкий уровень ввода/вывода в системе UNIX не пре-

дусматривает ни какой-либо буферизации, ни какого-либо дру-

гого сервиса; он по существу является непосредственным вхо-

дом в операционную систему. Весь ввод и вывод осуществляется

двумя функциями: READ и WRITE. Первым аргументом обеих функ-

ций является дескриптор файла. Вторым аргументом является

буфер в вашей программе, откуда или куда должны поступать

данные. Третий аргумент - это число подлежащих пересылке

байтов. Обращения к этим функциям имеют вид:

 

N_READ=READ(FD,BUF,N);

N_WRITTEN=WRITE(FD,BUF,N);

При каждом обращении возвращается счетчик байтов, указываю-

щий фактическое число переданных байтов. При чтении возвра-

щенное число байтов может оказаться меньше, чем запрошенное

число. Возвращенное нулевое число байтов означает конец фай-

ла, а “-1” указывает на наличие какой-либо ошибки. При запи-

си возвращенное значение равно числу фактически записанных

байтов; несовпадение этого числа с числом байтов, которое

предполагалось записать, обычно свидетельствует об ошибке.

Количество байтов, подлежащих чтению или записи, может

быть совершенно произвольным. Двумя самыми распространенными

величинами являются “1”, которая означает передачу одного

символа за обращение (т.е. Без использования буфера), и

“512”, которая соответствует физическому размеру блока на

многих периферийных устройствах. Этот последний размер будет

наиболее эффективным, но даже ввод или вывод по одному сим-

волу за обращение не будет необыкновенно дорогим.

Объединив все эти факты, мы написали простую программу

для копирования ввода на вывод, эквивалентную программе ко-

пировки файлов, написанной в главе 1. На системе UNIX эта

программа будет копировать что угодно куда угодно, потому

что ввод и вывод могут быть перенаправлены на любой файл или

устройство.

    

·     169 -

    

 

#DEFINE BUFSIZE 512 /*BEST SIZE FOR PDP-11 UNIX*/

MAIN() /*COPY INPUT TO OUTPUT*/

    \(

CHAR BUF[BUFSIZE];

INT N;

WHILE((N=READ(0,BUF,BUFSIZE))>0)

WRITE(1,BUF,N);

    \)

 

Если размер файла не будет кратен BUFSIZE, то при некотором

обращении к READ будет возвращено меньшее число байтов, ко-

торые затем записываются с помощью WRITE; при следующем пос-

ле этого обращении к READ будет возвращен нуль.

Поучительно разобраться, как можно использовать функции

READ и WRITE для построения процедур более высокого уровня,

таких как GETCHAR, PUTCHAR и т.д. Вот, например, вариант

функции GETCHAR, осуществляющий ввод без использования буфе-

ра.

#DEFINE CMASK 0377 /*FOR MAKING CHAR'S > 0*/

GETCHAR() /*UNBUFFERED SINGLE CHARACTER INPUT*/

    \(

CHAR C;

RETURN((READ(0,&C,1)>0 7 & CMASK : EOF);

    \)

 

Переменная “C” должна быть описана как CHAR, потому что фун-

кция READ принимает указатель на символы. Возвращаемый сим-

вол должен быть маскирован числом 0377 для гарантии его по-

ложительности; в противном случае знаковый разряд может сде-

лать его значение отрицательным. (Константа 0377 подходит

для эвм PDP-11, но не обязательно для других машин).

Второй вариант функции GETCHAR осуществляет ввод больши-

ми порциями, а выдает символы по одному за обращение.

#DEFINE CMASK 0377 /*FOR MAKING CHAR'S>0*/

#DEFINE BUFSIZE 512

GETCHAR() /*BUFFERED VERSION*/

   \(

STATIC CHAR  BUF[BUFSIZE];

STATIC CHAR  *BUFP = BUF;

STATIC INT   N = 0;

IF (N==0) \( /*BUFFER IS EMPTY*/

N=READ(0,BUF,BUFSIZE);

BUFP = BUF;

  \)

RETURN((--N>=0) ? *BUFP++ & CMASK : EOF);

   \)

    

8.3.   Открытие, создание, закрытие и расцепление

(UNLINK).

Кроме случая, когда по умолчанию определены стандартные

файлы ввода, вывода и ошибок, вы должны явно открывать фай-

лы, чтобы затем читать из них или писать в них. Для этой це-

ли существуют две точки входа: OPEN и CREAT.

    

·     170 -

    

Функция OPEN весьма сходна с функцией FOPEN, рассмотрен-

ной в главе 7, за исключением того, что вместо возвращения

указателя файла она возвращает дескриптор файла, который яв-

ляется просто целым типа INT.

 

INT FD;

FD=OPEN(NAME,RWMODE);

Как и в случае FOPEN, аргумент NAME является символьной

строкой, соответствующей внешнему имени файла. Однако аргу-

мент, определяющий режим доступа, отличен: RWMODE равно: 0 -

для чтения, 1 - для записи, 2 - для чтения и записи. Если

происходит какая-то ошибка, функция OPEN возвращает “-1”; в

противном случае она возвращает действительный дескриптор

файла.

Попытка открыть файл, который не существует, является

ошибкой. Точка входа CREAT предоставляет возможность созда-

ния новых файлов или перезаписи старых. В результате обраще-

ния

    

FD=CREAT(NAME,PMODE);

возвращает дескриптор файла, если оказалось возможным соз-

дать файл с именем NAME, и “-1” в противном случае. Если

файл с таким именем уже существует, CREAT усечет его до ну-

левой длины; создание файла, который уже существует, не яв-

ляется ошибкой.

Если файл является совершенно новым, то CREAT создает

его с определенным режимом защиты, специфицируемым аргумен-

том PMODE. В системе файлов на UNIX с файлом связываются де-

вять битов защиты информации, которые управляют разрешением

на чтение, запись и выполнение для владельца файла, для

группы владельцев и для всех остальных пользователей. Таким

образом, трехзначное восьмеричное число наиболее удобно для

спецификации разрешений. Например, число 0755 свидетельству-

ет о разрешении на чтение, запись и выполнение для владельца

и о разрешении на чтение и выполнение для группы и всех ос-

тальных.

Для иллюстрации ниже приводится программа копирования

одного файла в другой, являющаяся упрощенным вариантом ути-

литы CP системы UNIX. (Основное упрощение заключается в том,

что наш вариант копирует только один файл и что второй аргу-

мент не должен быть справочником).

 

#DEFINE NULL 0

#DEFINE BUFSIZE 512

#DEFINE PMODE 0644/*RW FOR OWNER,R FOR GROUP,OTHERS*/

MAIN(ARGC,ARGV) /*CP: COPY F1 TO F2*/

INT ARGC;

CHAR *ARGV[];

    \(

INT F1, F2, N;

CHAR BUF[BUFSIZE];

·          
171 -

    

IF (ARGC ! = 3)

ERROR(“USAGE:CP FROM TO”, NULL);

IF ((F1=OPEN(ARGV[1],0))== -1)

ERROR(“CP:CAN'T OPEN %S”, ARGV[1]);

IF ((F2=CREAT(ARGV[2],PMODE))== -1)

ERROR(“CP: CAN'T CREATE %S”, ARGV[2]);

WHILE ((N=READ(F1,BUF,BUFSIZE))>0)

IF (WRITE(F2,BUF,N) !=N)

ERROR(“CP: WRITE ERROR”, NULL);

EXIT(0);

    \)

ERROR(S1,S2) /*PRINT ERROR MESSAGE AND DIE*/

CHAR *S1, S2;

    \(

PRINTF(S1,S2);

PRINTF(“\N”);

EXIT(1);

    \)

 

Существует ограничение (обычно 15 - 25) на количество

файлов, которые программа может иметь открытыми одновремен-

но. В соответствии с этим любая программа, собирающаяся ра-

ботать со многими файлами, должна быть подготовлена к пов-

торному использованию дескрипторов файлов. Процедура CLOSE

прерывает связь между дескриптором файла и открытым файлом и

освобождает дескриптор файла для использования с некоторым

другим файлом. Завершение выполнения программы через EXIT

или в результате возврата из ведущей программы приводит к

закрытию всех открытых файлов.

Функция расцепления UNLINK (FILENAME) удаляет из системы

файлов файл с именем FILENAME ( из данного справочного фай-

ла. Файл может быть сцеплен с другим справочником, возможно,

под другим именем - примеч.переводчика).

Упражнение 8-1.

Перепишите программу CAT из главы 7, используя функции

READ, WRITE, OPEN и CLOSE вместо их эквивалентов из стандар-

тной библиотеки. Проведите эксперименты для определения от-

носительной скорости работы этих двух вариантов.

 

8.4.   Произвольный доступ - SEEK и LSEEK.

Нормально при работе с файлами ввод и вывод осуществля-

ется последовательно: при каждом обращении к функциям READ и

WRITE чтение или запись начинаются с позиции, непосредствен-

но следующей за предыдущей обработанной. Но при необходимос-

ти файл может читаться или записываться в любом произвольном

порядке. Обращение к системе с помощью функции LSEEK позво-

ляет передвигаться по файлу, не производя фактического чте-

ния или записи. В результате обращения

 

LSEEK(FD,OFFSET,ORIGIN);

·                 
172 -

    

текущая позиция в файле с дескриптором FD передвигается на

позицию OFFSET (смещение), которая отсчитывается от места,

указываемого аргументом ORIGIN (начало отсчета). Последующее

чтение или запись будут теперь начинаться с этой позиции.

Аргумент OFFSET имеет тип LONG; FD и ORIGIN имеют тип INT.

Аргумент ORIGIN может принимать значения 0,1 или 2, указывая

на то, что величина OFFSET должна отсчитываться соответст-

венно от начала файла, от текущей позиции или от конца фай-

ла. Например, чтобы дополнить файл, следует перед записью

найти его конец:

 

LSEEK(FD,0L,2);

чтобы вернуться к началу (“перемотать обратно”), можно напи-

сать:

 

LSEEK(FD,0L,0);

обратите внимание на аргумент 0L; его можно было бы записать

и в виде (LONG) 0.

Функция LSEEK позволяет обращаться с файлами примерно

так же, как с большими массивами, правда ценой более медлен-

ного доступа. следующая простая функция, например, считывает

любое количество байтов, начиная с произвольного места в

файле.

 

GET(FD,POS,BUF,N) /*READ N BYTES FROM POSITION POS*/

INT FD, N;

LONG POS;

CHAR *BUF;

    \(

LSEEK(FD,POS,0); /*GET TO POS*/

RETURN(READ(FD,BUF,N));

    \)

 

В более ранних редакциях, чем редакция 7 системы UNIX,

основная точка входа в систему ввода-вывода называется SEEK.

Функция SEEK идентична функции LSEEK, за исключением того,

что аргумент OFFSET имеет тип INT, а не LONG. в соответствии

с этим, поскольку на PDP-11 целые имеют только 16 битов, ар-

гумент OFFSET, указываемый функции SEEK, ограничен величиной

65535; по этой причине аргумент ORIGIN может иметь значения

3, 4, 5, которые заставляют функцию SEEK умножить заданное

значение OFFSET на 512 (количество байтов в одном физическом

блоке) и затем интерпретировать ORIGIN, как если это 0, 1

или 2 соответственно. Следовательно, чтобы достичь произ-

вольного места в большом файле, нужно два обращения к SEEK:

сначала одно, которое выделяет нужный блок, а затем второе,

где ORIGIN имеет значение 1 и которое осуществляет передви-

жение на желаемый байт внутри блока.

Упражнение 8-2.

Очевидно, что SEEK может быть написана в терминалах

LSEEK и наоборот. напишите каждую функцию через другую.

·                 
173 -

    

8.5.             Пример - реализация функций FOPEN и GETC.

Давайте теперь на примере реализации функций FOPEN и

GETC из стандартной библиотеки подпрограмм продемонстрируем,

как некоторые из описанных элементов объединяются вместе.

Напомним, что в стандартной библиотеке файлы описыватся

посредством указателей файлов, а не дескрипторов. Указатель

файла является указателем на структуру, которая содержит

несколько элементов информации о файле: указатель буфера,

чтобы файл мог читаться большими порциями; счетчик числа

символов, оставшихся в буфере; указатель следующей позиции

символа в буфере; некоторые признаки, указывающие режим чте-

ния или записи и т.д.; дескриптор файла.

Описывающая файл структура данных содержится в файле

STDIO.H, который должен включаться (посредством #INCLUDE) в

любой исходный файл, в котором используются функции из стан-

дартной библиотеки. Он также включается функциями этой биб-

лиотеки. В приводимой ниже выдержке из файла STDIO.H имена,

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28