патент
№ RU 2526282
МПК G06F13/14

СПОСОБ СИНХРОНИЗАЦИИ ДОСТУПА К РАЗДЕЛЯЕМЫМ РЕСУРСАМ ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ И ОБНАРУЖЕНИЯ И УСТРАНЕНИЯ ПОВИСШИХ БЛОКИРОВОК С ИСПОЛЬЗОВАНИЕМ БЛОКИРОВОЧНЫХ ФАЙЛОВ

Авторы:
Мардугаллямов Руслан Тахирович
Номер заявки
2012140253/08
Дата подачи заявки
21.09.2012
Опубликовано
20.08.2014
Страна
RU
Как управлять
интеллектуальной собственностью
Реферат

Изобретение относится к способу обнаружения и устранения повисших блокировок с использованием блокировочных файлов. Технический результат заключается в повышении надежности обнаружения и устранения повисших блокировок. Ассоциируют разделяемый ресурс с блокировочным файлом. Вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе. Помещают во временный файл информацию о текущем процессе, который пытается обратиться к разделяемому ресурсу. Осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл. Если системный вызов создания жесткой ссылки выполнен успешно, то удаляют жесткую ссылку на временный файл и обеспечивают выполнение текущим процессом операций с разделяемым ресурсом. Если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия: удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса; заносят в существующий блокировочный файл данные текущего процесса. Снимают файловую блокировку записи с существующего блокировочного файла. Обеспечивают выполнение текущим процессом операций с разделяемым ресурсом. Удаляют существующий блокировочный файл.

Формула изобретения

Способ синхронизации доступа к разделяемому ресурсу вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов, заключающийся в том, что
ассоциируют разделяемый ресурс с блокировочным файлом;
вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе, в которой предполагается создание блокировочного файла, со стороны текущего процесса, пытающегося получить доступ к разделяемому ресурсу;
помещают во временный файл информацию о текущем процессе, который пытается обратиться к разделяемому ресурсу;
осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл;
если системный вызов создания жесткой ссылки выполнен успешно, то:
удаляют жесткую ссылку на временный файл;
обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
удаляют блокировочный файл;
если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка не связана с тем, что файл с именем блокировочного файла уже существует, то удаляют временный файл;
если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка связана с тем, что файл с именем блокировочного файла уже существует, то:
удаляют временный файл;
осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:
устанавливают файловую блокировку записи на существующий блокировочный файл;
проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле;
если текущий процесс в системе существует, то снимают файловую блокировку записи на существующий блокировочный файл;
если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия:
удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса;
заносят в существующий блокировочный файл данные текущего процесса;
снимают файловую блокировку записи с существующего блокировочного файла;
обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;
удаляют существующий блокировочный файл.

Описание

[1]

Область техники, к которой относится изобретение

[2]

Предлагаемое изобретение относится к вычислительной технике и, в частности, к обеспечению синхронизации доступа к разделяемым ресурсам вычислительной системы и обнаружения и устранения повисших блокировок с использованием блокировочных файлов.

[3]

Уровень техники

[4]

В настоящее время известны способы синхронизации доступа параллельно выполняемых процессов (приложений) к разделяемым ресурсам вычислительной системы (в том числе файлам, участкам оперативной памяти и др.). При обеспечении синхронизации исключительный доступ предоставляется только одному процессу, а сам ресурс блокируется для записи и/или чтения для других процессов. Блокировка может осуществляться разными методами, однако возможны ситуации, когда ресурс оказывается заблокирован одновременно несколькими процессами и ни один из них не может ни снять блокировку, ни выполнить необходимые операции с разделяемым ресурсом.

[5]

Такое состояние обычно называют повисшей блокировкой (deadlock), а определяют его наличие и затем устраняют с использованием разных механизмов.

[6]

Так, известен способ предотвращения повисших блокировок [1] при выполнении обновлений хранилища данных в многопроцессорном устройстве, имеющем локальную кэш-память для каждого процессора, причем каждый процессор имеет возможность работы в быстром, медленном или расширенном медленном режиме, способ, заключающийся в том, что

[7]

- получают инструкцию, которая включает обращение к хранилищу данных;

[8]

- устанавливают процессор в быстрый режим, при котором множество инструкций выполняются параллельно, а целевая запись кэш-памяти, связанная с хранилищем данных, берется из локальной кэш-памяти с состоянием исключительного владения перед выполнением инструкции;

[9]

- инициализируют выполнение инструкции в быстром режиме;

[10]

- в ответ на обнаружение возможной повисшей блокировки во время выполнения инструкции в быстром режиме:

[11]

- прерывают выполнения инструкции в быстром режиме;

[12]

- устанавливают процессор в медленный режим, при котором выполняется единственная инструкция в текущий момент времени, а целевая запись кэш-памяти берется из локальной кэш-памяти с состоянием исключительного владения перед выполнением инструкции;

[13]

- инициализируют выполнение инструкции в медленном режиме;

[14]

- в ответ на обнаружение возможной повисшей блокировки во время выполнения инструкции в медленном режиме:

[15]

- прерывают выполнение инструкции в медленном режиме;

[16]

- устанавливают процессор в расширенный медленный режим, при котором выполняется единственная инструкция в текущий момент времени, а целевая запись кэш-памяти берется из локальной кэш-памяти с состоянием только чтения перед выполнением инструкции и с состоянием исключительного владения после завершения выполнения инструкции; и

[17]

- инициализируют выполнение инструкции в расширенном медленном режиме.

[18]

После того как выполнение инструкции завершено в расширенном медленном режиме, процессор может быть переведен обратно в быстрый режим.

[19]

Возможная повисшая блокировка считается обнаруженной, когда превышается предварительно задаваемое пороговое число исключительных отклонений без признаков окончания выполнения инструкции.

[20]

Этот способ имеет недостатки, среди которых можно отметить, в частности, необходимость перевода процессора в медленный и в расширенный медленный режим работы, что снижает производительность вычислительной системы. Кроме того, обнаружение повисшей блокировки носит вероятностный характер и зависит от предварительно задаваемого порогового числа исключительных отклонений.

[21]

Известен также способ синхронизации доступа к разделяемым ресурсам между параллельно выполняемыми процессами [2] с использованием механизма блокировочных файлов, заключающийся в том, что

[22]

- ассоциируют разделяемый ресурс с блокировочным файлом;

[23]

- создают в ходе попытки доступа процесса (приложения) к разделяемому ресурсу блокировочный файл;

[24]

- если такой блокировочный файл уже существует, эта операция будет завершена с ошибкой;

[25]

- если такой блокировочный файл не существует, то создается блокировочный файл;

[26]

- записывают в только что созданный и открытый блокировочный файл данные процесса, который его создал (идентификатор процесса (process ID, РID) и др.);

[27]

- обеспечивают выполнение процессом операций с разделяемым ресурсом;

[28]

- снимают блокировку с разделяемого ресурса (файла) путем удаления блокировочного файла.

[29]

Описанный способ принят за прототип.

[30]

Однако этот известный способ также имеет недостаток. Так, если процесс, владеющий блокировкой, завершился некорректно и не удалил блокировочный файл, то больше ни один процесс не сможет получить доступ к разделяемому ресурсу и возникает повисшая блокировка. Соответственно, надежность известного способа является невысокой.

[31]

Раскрытие изобретения

[32]

С целью исключения возможности появления повисших блокировок следует проверять наличие в системе процесса, данные которого указаны в существующем блокировочном файле.

[33]

Для этого предлагается способ, заключающийся в том, что

[34]

- ассоциируют разделяемый ресурс с блокировочным файлом;

[35]

- вызывают системный вызов атомарного эксклюзивного создания и открытия временного файла с уникальным именем и в той же файловой системе, в которой предполагается создание блокировочного файла, со стороны текущего процесса, пытающегося получить доступ к разделяемому ресурсу;

[36]

- помещают во временный файл информацию о текущем процессе (PID и/или др. сведения, по которым можно определить наличие данного процесса в системе), который пытается обратиться к разделяемому ресурсу;

[37]

- осуществляют системный вызов создания жесткой ссылки с именем блокировочного файла на временный файл;

[38]

- если системный вызов создания жесткой ссылки выполнен успешно, то:

[39]

- удаляют жесткую ссылку на временный файл;

[40]

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

[41]

- удаляют блокировочный файл;

[42]

- если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка не связана с тем, что файл с именем блокировочного файла уже существует, то удаляют временный файл;

[43]

- если системный вызов создания жесткой ссылки выполнен с ошибкой и ошибка связана с тем, что файл с именем блокировочного файла уже существует, то

[44]

- удаляют временный файл;

[45]

- осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:

[46]

- устанавливают файловую блокировку записи на существующий блокировочный файл;

[47]

- проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле;

[48]

- если текущий процесс в системе существует, то снимают файловую блокировку записи на существующий блокировочный файл;

[49]

- если текущий процесс в системе не существует, то выполняют устранение повисшей блокировки, осуществляя следующие действия:

[50]

- удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса;

[51]

- заносят в существующий блокировочный файл данные текущего процесса;

[52]

- снимают файловую блокировку записи с существующего блокировочного файла;

[53]

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

[54]

- удаляют существующий блокировочный файл.

[55]

Таким образом, если после проверки выясняется, что процесс, данные которого указаны в блокировочном файле, в данный момент в вычислительной системе не существует (например, произошел внутренний программный сбой и приложение операционной системой (ОС) было принудительно выгружено из оперативной памяти), то это не помешает обеспечить доступ к разделяемому ресурсу другим процессам и гарантировать отсутствие повисшей блокировки.

[56]

Техническим результатом является повышение надежности обнаружения и устранения повисших блокировок.

[57]

Осуществление изобретения

[58]

Реализация предложенного способа может быть осуществлена в вычислительной системе, работающей под управлением POSIX-совместимой ОС, в частности ОС GNU/Linux, где механизм блокировочных файлов для синхронизации доступа к разделяемому ресурсу получил широкое распространение.

[59]

Необходимым условием реализации предложенного способа является наличие в составе ОС вычислительной системы следующих средств, описанных в стандарте ISO/IEC/IEEE 9945-1:2008 [3]:

[60]

- системных вызовов для работы с файлами;

[61]

- операций атомарного эксклюзивного создания и открытия временного файла с уникальным именем (например, выполняемых с помощью системного вызова mkstemp);

[62]

- поддержка жестких ссылок ОС и файловой системой, в которой предполагается создание блокировочного файла;

[63]

- поддержка файловых блокировок и наличие системных вызовов для работы с ними.

[64]

Все указанные средства присутствуют в ОС GNU/Linux, в частности в доступном для любого пользователя дистрибутиве ОС Debian 6.

[65]

Жесткие ссылки поддерживаются большинством файловых систем, такой, в частности, как Ext3 (Extended File System версии 3), поддерживаемая в ОС Debian.

[66]

Для реализации способа в создаваемой или модернизируемой программе или программном модуле, предназначенном для работы с разделяемыми ресурсами, предусматривают осуществление следующих действий.

[67]

Ассоциируют разделяемый ресурс (например, последовательный порт) с блокировочным файлом. Это можно сделать, к примеру, сформировав константу, содержащую путь к блокировочному файлу.

[68]

В каждом процессе перед обращением к разделяемому ресурсу вызывают системный вызов mkstemp путем вызова одноименной системной функции, указав в качестве шаблона пути для создания временного файла путь в той же файловой системе, в которой предполагается создание блокировочного файла.

[69]

С помощью системного вызова write, помещают во временный файл информацию о текущем процессе, по которой можно определить наличие данного процесса в системе (в самом простом случае это может быть PID процесса), который пытается обратиться к разделяемому ресурсу.

[70]

Вызывают системный вызов link с помощью одноименной функции, передавая в качестве первого параметра путь к временному файлу, а в качестве второго параметра - путь к блокировочному файлу, с которым ассоциирован разделяемый ресурс.

[71]

Если функция link возвращает 0, то

[72]

- удаляют жесткую ссылку на временный файл, вызывая системный вызов unlink;

[73]

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

[74]

- удаляют блокировочный файл, используя системный вызов unlink. Если функция link возвращает - 1 и в errno (error return value) содержится код ошибки, отличный от EEXISTS, то удаляют временный файл.

[75]

Если функция link возвращает - 1 и в errno содержится код ошибки EEXISTS, то

[76]

- удаляют временный файл, для чего вызывают системный вызов unlink, передавая в качестве параметра путь к временному файлу;

[77]

- осуществляют поиск процесса, указанного в существующем блокировочном файле, выполняя следующие действия:

[78]

- открывают существующий блокировочный файл для записи, для чего выполняют системный вызов open, передавая в качестве первого параметра путь к блокировочному файлу, с которым ассоциирован разделяемый ресурс, а в качестве второго параметра - режим чтения/записи, и запоминают возвращаемый номер файлового дескриптора открытого блокировочного файла;

[79]

- устанавливают файловую блокировку записи, для чего вызывают системный вызов fcntl, передавая в качестве первого параметра номер файлового дескриптора открытого блокировочного файла, в качестве второго значения - F_SETLKW, в качестве третьего значения - заполненную структуру flock, для установки блокировки всего содержимого файла;

[80]

- читают содержимое файла с помощью системного вызова файла read;

[81]

- проверяют наличие в системе процесса, данные которого указаны в существующем блокировочном файле (для случая, когда в качестве данных о процессе выбран PID процесса, проверка может быть осуществлена путем выполнения системного вызова kill, передав в качестве первого параметра PID прочитанный из существующего блокировочного файла, а в качестве второго параметра - 0);

[82]

- если текущий процесс в системе существует (для случая, когда в качестве данных о процессе выбран PID процесса, системный вызов kill вернул 0), то снимают файловую блокировку записи на существующий блокировочный файл;

[83]

- если текущий процесс в системе не существует (для случая, когда в качестве данных о процессе выбран PID процесса,, системный вызов kill вернул -1 и errno содержит код ошибки ENOEXIST), то выполняют устранение повисшей блокировки, осуществляя следующие действия:

[84]

- удаляют из существующего блокировочного файла предыдущие данные несуществующего процесса, выполняя системный вызов trunc, передав в качестве параметра значения номер файлового дескриптора открытого блокировочного файла;

[85]

- определяют информацию о текущем процессе (для случая, когда используется PID - выполняют системный вызов getpid и сохраняют возвращаемое значение);

[86]

- заносят в существующий блокировочный файл данные текущего процесса, выполняя системный вызов write;

[87]

- снимают файловую блокировку записи с существующего блокировочного файла, для чего вызывают системный вызов fcntl, передавая в качестве первого параметра номер файлового дескриптора открытого блокировочного файла, в качестве второго значения - F_SETLKW, в качестве третьего значения - заполненную структуру flock, для снятия блокировки всего содержимого файла;

[88]

- обеспечивают выполнение текущим процессом операций с разделяемым ресурсом;

[89]

- удаляют существующий блокировочный файл, для чего вызывают системный вызов unlink, передавая в качестве параметра путь к блокировочному файлу.

[90]

Реализовать действия предложенного способа в составе программы или функции может специалист в области программирования (программист).

[91]

Источники информации

[92]

1. Патент США №7953932, приоритет от 13.02.2008 г.

[93]

2. Джонсон М.К., Троан Э.В. Разработка приложений в среде Linux, 2-е изд., Москва, 2007, стр.231-232.

[94]

3. Стандарт ISO/IEC/IEEE 9945-1:2008 Information technology - Portable Operating System Interface (POSIX®) Base Specifications.

Как компенсировать расходы
на инновационную разработку
Похожие патенты