.\" -*- coding: UTF-8 -*- '\" t .\" Copyright 2015-2017 Mathieu Desnoyers .\" .\" SPDX-License-Identifier: Linux-man-pages-copyleft .\" .\"******************************************************************* .\" .\" This file was generated with po4a. Translate the source file. .\" .\"******************************************************************* .TH membarrier 2 "31 октября 2023 г." "Linux man\-pages 6.06" .SH ИМЯ membarrier \- задаёт барьеры памяти в наборе нитей .SH LIBRARY Standard C library (\fIlibc\fP, \fI\-lc\fP) .SH СИНТАКСИС .nf .P \fB#include \fP /* определения констант \fBMEMBARRIER_*\fP */ \fB#include \fP /* определения констант \fBSYS_*\fP */ \fB#include \fP .P \fBint syscall(SYS_membarrier, int \fP\fIcmd\fP\fB, unsigned int \fP\fIflags\fP\fB, int \fP\fIcpu_id\fP\fB);\fP .fi .P \fINote\fP: glibc provides no wrapper for \fBmembarrier\fP(), necessitating the use of \fBsyscall\fP(2). .SH ОПИСАНИЕ Системный вызов \fBmembarrier\fP() помогает сократить накладные расходы инструкций барьера памяти, которые требуются при доступе к памяти в многоядерных системах. Однако данный системный вызов затратнее чем барьер памяти, поэтому чтобы использовать его эффективно \fIнедостаточно\fP просто заменить им барьеры памяти, требуется понимание описанного далее. .P При использовании барьеров памяти нужно принимать во внимание, что барьер памяти всегда должен или иметь противоположную сторону барьера, или что модель памяти архитектуры этого не требует. .P При работе бывает, что одна сторона барьера (которую будем называть «быстрой стороной») применяется чаще чем другая (которую будем называть «медленной стороной»). Это основная цель использования \fBmembarrier\fP(). Основная идея в замене этих барьеров: быстрые стороны барьеров — простыми барьерами компилятора: .P .in +4n .EX asm volatile ("" : : : "memory") .EE .in .P а медленные стороны барьеров — вызовами \fBmembarrier\fP(). .P Это добавит накладных расходов к медленной стороне и удалит расходы у быстрой стороны, что в результате повысит общую производительность в зависимости от того, как часто используются вызовы \fBmembarrier\fP() у медленной стороны, из\-за которой возникают издержки, и не перевесит ли это увеличение производительности быстрой стороны. .P Аргумент \fIcmd\fP может принимать одно из следующих значений: .TP \fBMEMBARRIER_CMD_QUERY\fP (начиная с Linux 4.3) Запросить набор поддерживаемых команд. Возвращаемое вызовом значение представляет собой битовую маску поддерживаемых команд. Сама команда \fBMEMBARRIER_CMD_QUERY\fP имеет значение 0 и не включается в эту маску. Данная команда поддерживается всегда (в ядрах с поддержкой \fBmembarrier\fP()). .TP \fBMEMBARRIER_CMD_GLOBAL\fP (начиная с Linux 4.16) Проверить, что все потоки всех процессов в системе прошли через состояние, где все доступы к памяти по адресам пространства пользователя соответствуют программному порядку между входом и возвратом из системного вызова \fBmembarrier\fP(). Все потоки в системе являются целью этой команды. .TP \fBMEMBARRIER_CMD_GLOBAL_EXPEDITED\fP (начиная с Linux 4.16) Установить барьер памяти во всех выполняющихся нитях всех процессов, которые были ранее зарегистрированы с помощью \fBMEMBARRIER_CMD_REGISTER_GLOBAL_EXPEDITED\fP. .IP После возврата из системного вызова вызвавшей нити гарантируется, что все выполняющиеся нити прошли через состояние, где все доступы к памяти по адресам пространства пользователя соответствуют программному порядку между входом и возвратом из системного вызова (не выполняющиеся нити уже в таком состоянии). Это гарантируется только для нитей процессов, которые были ранее зарегистрированы с помощью \fBMEMBARRIER_CMD_REGISTER_GLOBAL_EXPEDITED\fP. .IP Учтите, что регистрация о намерении получать барьеры допускается вызовом \fBMEMBARRIER_CMD_GLOBAL_EXPEDITED\fP только из процесса, который не использовал \fBMEMBARRIER_CMD_REGISTER_GLOBAL_EXPEDITED\fP. .IP «Курируемые» (expedited) команды выполняются быстрее чем не курируемые; они никогда не блокируются, но на них приходятся дополнительные издержки. .TP \fBMEMBARRIER_CMD_REGISTER_GLOBAL_EXPEDITED\fP (начиная с Linux 4.16) Зарегистрировать намерение процесса получать барьеры памяти \fBMEMBARRIER_CMD_GLOBAL_EXPEDITED\fP. .TP \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED\fP (начиная с Linux 4.14) Применить барьер памяти на все выполняющиеся нити, принадлежащие тому же процессу, что и вызвавшая нить. .IP После возврата из системного вызова вызвавшей нити гарантируется, что все выполняющиеся, одноуровневые с ней нити прошли через состояние, где все доступы к памяти по адресам пространства пользователя соответствуют программному порядку между входом и возвратом из системного вызова (невыполняющиеся нити уже в таком состоянии). Это гарантируется только для нитей того же процесса, что и вызвавшая нить. .IP «Курируемые» (expedited) команды выполняются быстрее чем не курируемые; они никогда не блокируются, но на них приходятся дополнительные издержки. .IP Процессу нужно регистрировать своё намерение использовать частную курируемую команду до её использования. .TP \fBMEMBARRIER_CMD_REGISTER_PRIVATE_EXPEDITED\fP (начиная с Linux 4.14) Зарегистрировать намерение процесса использовать \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED\fP. .TP \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED_SYNC_CORE\fP (начиная с Linux 4.16) В дополнении к гарантии упорядочивания памяти, описанной в \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED\fP, после возврата из системного вызова вызвавшей нити гарантируется, что все выполняющиеся, одноуровневые с ней нити выполнили ядерную инструкцию сериализации (core serializing instruction). Это гарантируется только для нитей того же процесса, что и вызвавшая нить. .IP «Курируемые» (expedited) команды выполняются быстрее чем не курируемые; они никогда не блокируются, но на них приходятся дополнительные издержки. .IP Процессу нужно регистрировать своё намерение использовать частную курируемую ядерную команду синхронизации до её использования. .TP \fBMEMBARRIER_CMD_REGISTER_PRIVATE_EXPEDITED_SYNC_CORE\fP (начиная с Linux 4.16) Зарегистрировать намерение процесса использовать \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED_SYNC_CORE\fP. .TP \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED_RSEQ\fP (начиная с Linux 5.10) Ensure the caller thread, upon return from system call, that all its running thread siblings have any currently running rseq critical sections restarted if \fIflags\fP parameter is 0; if \fIflags\fP parameter is \fBMEMBARRIER_CMD_FLAG_CPU\fP, then this operation is performed only on CPU indicated by \fIcpu_id\fP. This guarantee is provided only for threads in the same process as the calling thread. .IP RSEQ membarrier is only available in the "private expedited" form. .IP A process must register its intent to use the private expedited rseq command prior to using it. .TP \fBMEMBARRIER_CMD_REGISTER_PRIVATE_EXPEDITED_RSEQ\fP (начиная с Linux 5.10) Зарегистрировать намерение процесса использовать \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED_RSEQ\fP. .TP \fBMEMBARRIER_CMD_SHARED\fP (начиная с Linux 4.3) Псевдоним \fBMEMBARRIER_CMD_GLOBAL\fP, существует для обратной совместимости в заголовке. .P The \fIflags\fP argument must be specified as 0 unless the command is \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED_RSEQ\fP, in which case \fIflags\fP can be either 0 or \fBMEMBARRIER_CMD_FLAG_CPU\fP. .P The \fIcpu_id\fP argument is ignored unless \fIflags\fP is \fBMEMBARRIER_CMD_FLAG_CPU\fP, in which case it must specify the CPU targeted by this membarrier command. .P Все доступы к памяти, выполняемые в программном порядке из каждого целевого потока, гарантированно упорядочены в отношении \fBmembarrier\fP(). .P Если использовать семантику \fIbarrier()\fP для представления барьера компилятора, обеспечивающего доступа к памяти, выполняемого в программном порядке для пересечения барьера, и \fIsmp_mb()\fP — для представления явных барьеров памяти, обеспечивающих полный упорядоченный доступ к памяти через барьер, то получится следующая упорядочивающая таблица для каждой пары \fIbarrier()\fP, \fBmembarrier\fP() и \fIsmp_mb()\fP. Наличие порядка в паре показано знаком (O: упорядочено, X: не упорядочено): .P .RS .TS l c c c. \& barrier() smp_mb() membarrier() barrier() X X O smp_mb() X O O membarrier() O O O .TE .RE .SH "ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ" On success, the \fBMEMBARRIER_CMD_QUERY\fP operation returns a bit mask of supported commands, and the \fBMEMBARRIER_CMD_GLOBAL\fP, \fBMEMBARRIER_CMD_GLOBAL_EXPEDITED\fP, \fBMEMBARRIER_CMD_REGISTER_GLOBAL_EXPEDITED\fP, \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED\fP, \fBMEMBARRIER_CMD_REGISTER_PRIVATE_EXPEDITED\fP, \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED_SYNC_CORE\fP, and \fBMEMBARRIER_CMD_REGISTER_PRIVATE_EXPEDITED_SYNC_CORE\fP operations return zero. On error, \-1 is returned, and \fIerrno\fP is set to indicate the error. .P Для данной команды, если флаг \fIflags\fP равен 0, то системный вызов всегда гарантирует возврат одного и того же значения до перезагрузки. Последующие вызовы с теми же аргументами всегда возвращают тот же результат. Поэтому, если \fIflags\fP равен 0, то обработка ошибок требуется только при первом вызове \fBmembarrier\fP(). .SH ОШИБКИ .TP \fBEINVAL\fP Неверное значение \fIcmd\fP, значение \fIflags\fP не равно нулю, отключена команда \fBMEMBARRIER_CMD_GLOBAL\fP, так как указан параметр ЦП \fInohz_full\fP или команды \fBMEMBARRIER_CMD_PRIVATE_EXPEDITED_SYNC_CORE\fP и\fBMEMBARRIER_CMD_REGISTER_PRIVATE_EXPEDITED_SYNC_CORE\fP не реализованы для архитектуры. .TP \fBENOSYS\fP Системный вызов \fBmembarrier\fP() не реализован в данном ядре. .TP \fBEPERM\fP Текущий процесс не зарегистрирован до использования частных курируемых команд. .SH СТАНДАРТЫ Linux. .SH ИСТОРИЯ Linux 4.3. .P Before Linux 5.10, the prototype was: .P .in +4n .EX \fBint membarrier(int \fP\fIcmd\fP\fB, int \fP\fIflags\fP\fB);\fP .EE .in .SH ЗАМЕЧАНИЯ Инструкция барьера памяти является частью системы команд архитектуры со слабо упорядоченными моделями памяти. Она упорядочивает доступ к памяти до барьера и после барьера в соответствии совпадающими барьерами на других ядрах. Например, загрузка барьера (fence) может упорядочить загрузку до и после этого барьера в соответствии порядком хранилища, установленного барьерами хранилища. .P Программный порядок — это порядок, в котором инструкции упорядочены в ассемблерном коде программы. .P Вызов \fBmembarrier\fP() может быть полезным для реализации библиотек чтения\-копирования\-обновления или сборщиков мусора. .SH ПРИМЕРЫ Предполагая, что в многонитевой программе «fast_path()» выполняется очень часто, а «slow_path()» — редко, следующий код (x86) можно преобразовать используя \fBmembarrier\fP(): .P .in +4n .\" SRC BEGIN (membarrier.c) .EX #include \& static volatile int a, b; \& static void fast_path(int *read_b) { a = 1; asm volatile ("mfence" : : : "memory"); *read_b = b; } \& static void slow_path(int *read_a) { b = 1; asm volatile ("mfence" : : : "memory"); *read_a = a; } \& int main(void) { int read_a, read_b; \& /* * Real applications would call fast_path() and slow_path() * from different threads. Call those from main() to keep * this example short. */ \& slow_path(&read_a); fast_path(&read_b); \& /* * read_b == 0 implies read_a == 1 and * read_a == 0 implies read_b == 1. */ \& if (read_b == 0 && read_a == 0) abort(); \& exit(EXIT_SUCCESS); } .EE .\" SRC END .in .P Этот же код, переписанный с использованием \fBmembarrier\fP(): .P .in +4n .EX #define _GNU_SOURCE #include #include #include #include #include \& static volatile int a, b; \& static int membarrier(int cmd, unsigned int flags, int cpu_id) { return syscall(__NR_membarrier, cmd, flags, cpu_id); } \& static int init_membarrier(void) { int ret; \& /* Check that membarrier() is supported. */ \& ret = membarrier(MEMBARRIER_CMD_QUERY, 0, 0); if (ret < 0) { perror("membarrier"); return \-1; } \& if (!(ret & MEMBARRIER_CMD_GLOBAL)) { fprintf(stderr, "membarrier does not support MEMBARRIER_CMD_GLOBAL\en"); return \-1; } \& return 0; } \& static void fast_path(int *read_b) { a = 1; asm volatile ("" : : : "memory"); *read_b = b; } \& static void slow_path(int *read_a) { b = 1; membarrier(MEMBARRIER_CMD_GLOBAL, 0, 0); *read_a = a; } \& int main(int argc, char *argv[]) { int read_a, read_b; \& if (init_membarrier()) exit(EXIT_FAILURE); \& /* * Real applications would call fast_path() and slow_path() * from different threads. Call those from main() to keep * this example short. */ \& slow_path(&read_a); fast_path(&read_b); \& /* * read_b == 0 implies read_a == 1 and * read_a == 0 implies read_b == 1. */ \& if (read_b == 0 && read_a == 0) abort(); \& exit(EXIT_SUCCESS); } .EE .in .\" .SH SEE ALSO .\" FIXME See if the following syscalls make it into Linux 4.15 or later .\" .BR cpu_opv (2), .\" .BR rseq (2) .PP .SH ПЕРЕВОД Русский перевод этой страницы руководства был сделан aereiae , Alexey , Azamat Hackimov , Dmitriy S. Seregin , Dmitry Bolkhovskikh , ITriskTI , Max Is , Yuri Kozlov , Иван Павлов и Малянов Евгений Викторович . .PP Этот перевод является бесплатной документацией; прочитайте .UR https://www.gnu.org/licenses/gpl-3.0.html Стандартную общественную лицензию GNU версии 3 .UE или более позднюю, чтобы узнать об условиях авторского права. Мы не несем НИКАКОЙ ОТВЕТСТВЕННОСТИ. .PP Если вы обнаружите ошибки в переводе этой страницы руководства, пожалуйста, отправьте электронное письмо на .MT man-pages-ru-talks@lists.sourceforge.net .ME .