EXECVE(2) Manuel du programmeur Linux EXECVE(2)

execve - Exécuter un programme

#include <unistd.h>
int execve(const char *pathname, char *const argv[],
           char *const envp[]);

execve() exécute le programme auquel renvoie pathname. Il s'ensuit que le programme en cours d'exécution par le processus appelant sera remplacé par un nouveau programme, avec une pile, un tas et des segments de données (initialisés ou non) nouvellement initialisés.

pathname doit être soit un exécutable binaire, soit un script qui commence par une ligne sous la forme :


#!interpréteur [argument-optionnel]

Pour des détails sur ce dernier cas, consultez « Scripts » ci‐dessous.

argv est un tableau de pointeurs vers des chaînes passées au nouveau programme en tant qu'arguments de la ligne de commande. Par convention, la première de ces chaînes (à savoir argv[0]) devrait contenir le nom de fichier associé au fichier étant exécuté. Le tableau argv doit se terminer par un pointeur NULL (ainsi, dans le nouveau programme, argv[argc] vaudra NULL).

envp est un tableau de pointeurs vers des chaînes, ayant par convention la forme clé=valeur, qui sont passés au nouveau programme en tant qu'environnement. Le tableau envp dois se terminer par un pointeur NULL.

Le vecteur d'argument et l'environnement sont accessibles à la fonction principale du nouveau programme quand elle est définie ainsi :


int main(int argc, char *argv[], char *envp[])

Notez, cependant, que l'utilisation d'un troisième argument dans la fonction principale n'est pas spécifiée dans POSIX.1, selon laquelle l'environnement doit être accessible par la variable externe environ(7).

En cas de réussite, execve() ne renvoie rien et les segments de texte, les données initialisées et non initialisées « bss »), ainsi que la pile du processus appelant sont remplacés par ceux du programme chargé.

Si l'on effectuait un ptrace(2) sur le programme actuel, un signal SIGTRAP lui est envoyé après la réussite de execve().

Si le bit set-user-ID est positionné sur le fichier du programme auquel renvoie pathname, l'ID de l'utilisateur effectif du processus appelant passe à celui du propriétaire du programme. De même, lorsque le bit set-group-ID est positionné sur le fichier du programme, l'ID du groupe effectif du processus appelant est modifié pour correspondre à celui du groupe du fichier.

Les transformations précitées des ID effectifs ne sont pas effectuées (c'est-à-dire que les bits set-user-ID et set-group-ID sont ignorés) si un des éléments suivants est vrai :

  • l'attribut no_new_privs est défini pour le thread appelant (voir prctl(2)) ;
  • le système de fichiers sous-jacent est monté en nosuid (le drapeau MS_NOSUID de mount(2)) ;
  • ou un ptrace va être appliqué au processus appelant.

Les capacités du fichier du programme (voir capabilities(7)) sont également ignorées si un des éléments ci-dessus est vrai.

L'UID effectif du processus est copié dans le Set-UID sauvegardé ; de la même manière, le GID effectif est copié dans le Set-GID sauvegardé. Ces copies ont lieu après toute modification d'ID effectif à cause des bits de permission Set-UID et Set-GID.

The process's real UID and real GID, as well as its supplementary group IDs, are unchanged by a call to execve().

Si l'exécutable est un fichier binaire a.out lié dynamiquement, et contenant des appels aux bibliothèques partagées, l'éditeur de liens dynamiques de Linux ld.so(8) est appelé au début de l'exécution, afin de charger les bibliothèques partagées nécessaires en mémoire et d'effectuer l'édition des liens de l'exécutable avec eux.

Si l'exécutable est au format ELF lié dynamiquement, l'interpréteur indiqué dans le segment PT_INTERP sera invoqué pour charger les bibliothèques partagées. Cet interpréteur est généralement /lib/ld-linux.so.2 pour les fichiers binaires liés avec la glibc (voir ld-linux.so(8)).

Tous les attributs de processus sont préservés lors d'un execve(), à l'exception des suivants :

  • Les signaux pour lesquels le processus avait placé un gestionnaire sont réinitialisés à leur valeur par défaut (consultez signal(7)).
  • L'éventuelle pile spécifique pour les gestionnaires de signal n'est pas conservée (sigaltstack(2)).
  • Les projections en mémoire ne sont pas conservées (mmap(2)).
  • Les segments de mémoire partagée System V sont détachés (shmat(2)).
  • Les objets de mémoire partagée POSIX sont supprimés (shm_open(3)).
  • Les descripteurs de files de messages POSIX ouverts sont fermés (mq_overview(7)).
  • Les sémaphores nommés POSIX ouverts sont fermés (sem_overview(7)).
  • Les temporisations POSIX ne sont pas conservées (timer_create(2)).
  • Les flux de répertoires ouverts sont fermés (opendir(3)).
  • Les verrouillages de mémoire ne sont pas préservés (mlock(2), mlockall(2)).
  • Les gestionnaires de terminaison ne sont pas préservés (atexit(3), on_exit(3)).
  • L'environnement de travail en virgule flottante est réinitialisé à celui par défaut (consultez fenv(3)).

Les attributs de processus listés ci-dessus sont spécifiés dans POSIX.1. Les attributs de processus spécifiques à Linux suivants sont également réinitialisés lors d'un execve() :

  • L'attribut « dumpable » du processus est positionné sur la valeur 1, sauf si un programme set-user-ID, set-group-ID ou en ayant les capacités est exécuté, auquel cas l'attribut dumpable peut, au contraire, être réinitialisé à la valeur dans /proc/sys/fs/suid_dumpable, dans les circonstances décrites sous PR_SET_DUMPABLE dans prctl(2). Remarquez que les modifications d'un attribut « dumpable » peut entraîner le passage du propriétaire des fichiers du répertoire /proc/[pid] de processus à root:root, comme décrit dans proc(5).
  • L'attribut PR_SET_KEEPCAPS de prctl(2) est effacé.
  • (Depuis Linux 2.4.36 ou 2.6.23) Si un programme setuid ou setgid est exécuté, alors le signal de mort de son parent défini par l'attribut PR_SET_PDEATHSIG de prctl(2) est effacé.
  • Le nom du processus, positionné par prctl(2) PR_SET_NAME (et affiché avec ps -o comm), est réinitialisé avec le nom du nouvel exécutable.
  • L'attribut securebits SECBIT_KEEP_CAPS de prctl() est effacé. Consultez capabilities(7).
  • Le signal de terminaison est réinitialisé à SIGCHLD (consultez clone(2)).
  • La table des descripteurs de fichier n'est pas partagée, ce qui annule les effets de l'attribut CLONE_FILES de clone(2).

Notez également les points suivants :

  • Tous les threads autres que l'appelant sont détruits lors d'un execve(). Les mutex, les variables de condition, et les autres objets de pthreads sont détruits.
  • L'équivalent de setlocale(LC_ALL, "C") est exécuté au démarrage du programme.
  • POSIX.1 indique que les actions pour les signaux ignorés ou placés à la valeur par défaut ne sont pas modifiées. Une exception est néanmoins spécifiée dans POSIX.1 : si SIGCHLD est ignoré, l'implémentation peut laisser l'action inchangée ou la replacer à la valeur par défaut ; Linux ne modifie pas l'action.
  • Toutes les opérations d'E/S asynchrones en cours sont annulées (aio_read(3), aio_write(3)).
  • Pour le traitement des capacités lors d'un execve(), consultez capabilities(7).
  • Par défaut, les descripteurs de fichier restent ouverts au travers d'un execve(). Les descripteurs marqués close-on-exec sont fermés ; consultez la description de FD_CLOEXEC dans fcntl(2). (Si un descripteur de fichier est fermé, cela cause la libération de tous les verrous d'enregistrement obtenus sur le fichier correspondant par ce processus. Consultez fcntl(2) pour les détails.) POSIX.1 indique que si les descripteurs de fichiers 0, 1 et 2 devaient être fermés après un execve() réussi, et que le processus devient privilégié en raison d'un bit set-user-ID ou set-group-ID sur le fichier exécuté, le système peut ouvrir un fichier non indiqué pour chacun de ces descripteurs. En général, aucun programme portable, privilégié ou pas, ne peut considérer que ces trois descripteurs resteront fermés après un execve().

Un script d’interpréteur est un fichier textuel dont le bit d'exécution est activé et dont la première ligne est de la forme :


#!interpréteur [argument-optionnel]

L’interpréteur doit être le chemin valable d'un fichier exécutable.

Si l'argument pathname de execve() indique un script interprété, l'interpréteur sera appelé avec les arguments suivants :


interpréteur [argument-optionnel] pathname arg...

where pathname is the pathname of the file specified as the first argument of execve(), and arg... is the series of words pointed to by the argv argument of execve(), starting at argv[1]. Note that there is no way to get the argv[0] that was passed to the execve() call.

Pour être portable, argument-optionnel doit soit être absent, soit être un seul mot (c'est‐à‐dire ne pas contenir d'espace) ; consultez les NOTES ci‐dessous.

Depuis Linux 2.6.28, le noyau autorise l'interpréteur de script à être lui-même un script. Cette autorisation est récursive jusqu'à quatre niveaux, pour qu'un interpréteur puisse être interprété par un script qui est interprété par un script, et ainsi de suite.

La plupart des implémentations UNIX imposent des limites sur la taille totale des chaînes des paramètres des lignes de commande (argv) et de l'environnement (envp) qui peuvent être passées à un nouveau programme. POSIX.1 permet à une implémentation d'annoncer cette limite en utilisant la constante ARG_MAX (soit définie dans <limits.h>, soit disponible à l'exécution en utilisant l'appel sysconf(_SC_ARG_MAX)).

Sur les noyaux Linux antérieurs à 2.6.23, la mémoire utilisée pour stocker les chaînes d'environnements et d'arguments était limitée à 32 pages (définie par la constante noyau MAX_ARG_PAGES). Sur les architectures dont la taille de page est 4 Ko, cela donne un maximum de 128 Ko.

On kernel 2.6.23 and later, most architectures support a size limit derived from the soft RLIMIT_STACK resource limit (see getrlimit(2)) that is in force at the time of the execve() call. (Architectures with no memory management unit are excepted: they maintain the limit that was in effect before kernel 2.6.23.) This change allows programs to have a much larger argument and/or environment list. For these architectures, the total size is limited to 1/4 of the allowed stack size. (Imposing the 1/4-limit ensures that the new program always has some stack space.) Additionally, the total size is limited to 3/4 of the value of the kernel constant _STK_LIM (8 MiB). Since Linux 2.6.25, the kernel also places a floor of 32 pages on this size limit, so that, even when RLIMIT_STACK is set very low, applications are guaranteed to have at least as much argument and environment space as was provided by Linux 2.6.22 and earlier. (This guarantee was not provided in Linux 2.6.23 and 2.6.24.) Additionally, the limit per string is 32 pages (the kernel constant MAX_ARG_STRLEN), and the maximum number of strings is 0x7FFFFFFF.

On success, execve() does not return, on error -1 is returned, and errno is set to indicate the error.

Le nombre total d'octets dans l'environnement (envp) et la liste d'arguments (argv) est trop grande.
Le droit de parcours est refusé pour un des composants du préfixe du chemin pathname ou du nom d'un interpréteur de script (consultez aussi path_resolution(7)).
Le fichier ou l'interpréteur de script n'est pas un fichier régulier.
L'autorisation d'exécution est refusée pour le fichier, ou un interpréteur de script, ou un interpréteur ELF.
Le système de fichiers est monté avec l'option noexec.
Ayant modifié son UID réel avec un des appels set*uid(), l’appelant était – et est toujours — au-delà de sa limite de ressources RLIMIT_NPROC (consultez setrlimit(2)). Pour une explication plus précise de cette erreur, consultez NOTES.
pathname ou l'un des pointeurs du vecteur argv ou envp pointe en dehors de l'espace d'adressage accessible.
Un exécutable ELF a plusieurs segments PT_INTERP (indique plusieurs interpréteurs).
Une erreur d'entrée-sortie s'est produite.
L'interpréteur ELF cité est un répertoire.
L'interpréteur ELF mentionné n'est pas dans un format connu.
Trop de liens symboliques rencontrés dans la résolution de pathname ou du nom de l'interpréteur de script ou ELF.
La limite maximale de niveaux a été atteinte pendant l'interprétation récursive du script (voir « scripts interpréteurs » ci-dessus). Avant Linux 3.8, l'erreur générée dans ce cas était ENOEXEC.
La limite du nombre de descripteurs de fichiers par processus a été atteinte.
nom_chemin est trop long.
La limite du nombre total de fichiers ouverts pour le système entier a été atteinte.
Aucun fichier pathname ou interpréteur de script ou ELF n'existe.
Le fichier exécutable n'est pas dans le bon format, ou est destiné à une autre architecture.
La mémoire disponible du noyau n'était pas suffisante.
Un composant du préfixe du chemin de pathname ou de l'interpréteur de script ou ELF n'est pas un répertoire.
Le système de fichiers est monté avec l'attribut nosuid, l’utilisateur n’est pas le superutilisateur et le fichier a un bit Set-UID ou Set-GID positionné.
Le processus est suivi avec ptrace(2), l'utilisateur n'est pas le superutilisateur, et le fichier a un bit Set-UID ou Set-GID positionné.
Une application « capability-dumb » n'obtiendrait pas toutes les capacités rendues possibles par le fichier exécutable. Voir capabilities(7).
L'exécutable spécifié était ouvert en écriture par un ou plusieurs processus.

POSIX.1-2001, POSIX.1-2008, SVr4, 4.3BSD. POSIX ne documente pas le comportement de « #! » mais celui-ci existe (avec quelques variations) sur d'autres systèmes UNIX.

On pourrait parfois voir execve() (et les fonctions associées décrites dans exec(3)) décrit comme un « exécuteur de nouveau processus » (ou équivalent). C'est une description très trompeuse : il n'y a pas de nouveau processus ; beaucoup d'attributs du processus appelant demeurent inchangés (en particulier son PID). Tout ce que fait execve() est de s'organiser pour qu'un processus existant (le processus appelant) exécute un nouveau programme.

Les processus Set-UID et Set-GID ne peuvent pas être suivis par ptrace(2).

Le résultat d'un montage de système de fichiers avec l'attribut nosuid peut varier suivant les versions du noyau Linux : certaines refuseront l'exécution des fichiers Set-UID et Set-GID lorsque cela donnerait à l'appelant des privilèges qu'il n'a pas (et renverront l'erreur EPERM), d'autres ignoreront simplement les bits Set-UID et Set-GID mais accepteront d'effectuer l'appel exec().

Sur Linux, argv et envp peuvent être indiqués comme NULL. Dans les deux cas, cela a le même effet que de spécifier un argument comme un pointeur sur une liste contenant un seul pointeur NULL. N'en profitez pas pour faire des choses non standard et non portables !. Sur de nombreux autres systèmes UNIX, spécifier argv comme NULL donnera une erreur (EFAULT). D'autres systèmes UNIX traitent le cas envp==NULL comme Linux.

POSIX.1 indique que les valeurs renvoyées par sysconf(3) ne doivent pas changer pendant la vie d'un processus. Cependant, depuis Linux 2.6.23, si la limite de ressources RLIMIT_STACK change, alors la valeur renvoyée par _SC_ARG_MAX changera également, pour refléter le fait que la limite de l'espace qui reçoit les paramètres de la ligne de commande et les variables d'environnement a changé.

Dans la plupart des cas où execve() échoue, le contrôle renvoie vers l’image exécutable d’origine et l’appelant de execve() peut alors traiter l’erreur. Cependant, dans de (rares) cas (typiquement provoqués par un épuisement de ressources), l’échec pourrait se produire après le point de non-retour : l’image exécutable d’origine a été supprimée, mais la nouvelle image n’a pas pu être construite complètement. Dans ces cas-là, le noyau tue le processus avec un signal SIGSEGV (SIGKILL jusqu'à Linux 3.17).

Le noyau impose une longueur maximale de texte après les caractères « #! » au début du script ; les caractères au-delà de cette limite sont ignorés. Avant Linux 5.1, la limite était de 127 caractères. Depuis Linux 5.1, elle est de 255 caractères.

La sémantique de l'argument-optionnel d'un script diffère selon les implémentations. Sous Linux, la chaîne qui suit le nom de l'interpréteur est passée à l'interpréteur comme un seul mot, et cette chaîne peut contenir des espaces. Cependant, le comportement est différent sur d'autres systèmes. Certains utilisent la première espace comme fin de l'argument-optionnel. Sur certains systèmes, un script peut avoir plusieurs arguments, délimités par des espaces dans argument-optionnel.

Linux (comme la plupart des autres systèmes UNIX modernes) ignore les bits Set-UID et Set-GID sur les scripts.

Une explication plus détaillée de l’erreur EAGAIN qui peut se produire (depuis Linux 3.1) en appelant execve() est comme suit.

L’erreur EAGAIN peut se produire quand un appel précédent de setuid(2), setreuid(2) ou setresuid(2) a causé la modification de l’identifiant d’utilisateur réel du processus et que cette modification a forcé le processus à dépasser sa limite de ressources RLIMIT_NPROC (c’est-à-dire que le nombre de processus appartenant au nouvel UID réel dépasse la limite de ressources). De Linux 2.6.0 à 3.0, cela provoquait un échec de l’appel set*uid() (avant 2.6, la limite de ressources n’était pas imposée sur les processus qui modifiaient leurs identifiants d’utilisateur).

Depuis Linux 3.1, le scénario précédemment décrit ne provoque plus un échec de l’appel set*uid(), parce que cela avait trop souvent pour conséquence des trous de sécurité quand les applications boguées ne vérifiaient pas l’état de retour et assumait que — si l’appelant avait les droits du superutilisateur — l’appel réussirait toujours. À la place, les appels set*uid() modifient vraiment l’UID réel, mais le noyau définit un attribut interne, appelé PF_NPROC_EXCEEDED, pour noter que la limite de ressources RLIMIT_NPROC a été dépassée. Si l’attribut PF_NPROC_EXCEEDED est défini et que la limite de ressources est toujours dépassée au moment d’un appel execve() ultérieur, cet appel échoue avec l’erreur EAGAIN. Cette logique du noyau assure que la limite de ressources RLIMIT_NPROC est toujours respectée pour le mode de fonctionnement habituel du démon avec droits — c’est-à-dire fork(2) + set*uid() + execve().

Si la limite de ressources n’était pas encore dépassée au moment de l’appel execve() (parce que d’autres processus appartenant à cet UID réel se sont terminés entre l’appel set*uid() et l’appel execve()), alors l’appel execve() réussit et le noyau efface l’attribut de processus PF_NPROC_EXCEEDED. L’attribut est aussi effacé si un appel ultérieur de fork(2) par ce processus réussit.

Avec UNIX V6, la liste des arguments d'un appel exec() se terminait par 0, alors que la liste des arguments de main se terminait par -1. Aussi, cette liste d'arguments n'était pas utilisable directement dans un appel exec() supplémentaire. Depuis UNIX V7, les deux terminateurs sont NULL.

Le programme suivant est conçu pour être exécuté par le second programme ci‐dessous. Il se contente d'afficher les paramètres de sa ligne de commande, un par ligne.


/* myecho.c */
#include <stdio.h>
#include <stdlib.h>
int
main(int argc, char *argv[])
{

for (int j = 0; j < argc; j++)
printf("argv[%d]: %s\n", j, argv[j]);
exit(EXIT_SUCCESS); }

Ce programme peut être utilisé pour exécuter le programme donné comme argument de ligne de commande :


/* execve.c */
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int
main(int argc, char *argv[])
{

char *newargv[] = { NULL, "hello", "world", NULL };
char *newenviron[] = { NULL };
if (argc != 2) {
fprintf(stderr, "Utilisation : %s <fichier_à_exécuter>\n", argv[0]);
exit(EXIT_FAILURE);
}
newargv[0] = argv[1];
execve(argv[1], newargv, newenviron);
perror("execve"); /* execve() ne renvoie qu'en cas d'erreur */
exit(EXIT_FAILURE); }

On peut utiliser le second programme pour exécuter le premier de la façon suivante :


$ cc myecho.c -o myecho
$ cc execve.c -o execve
$ ./execve ./myecho
argv[0]: ./myecho
argv[1]: hello
argv[2]: world

On peut aussi utiliser ces programmes pour montrer l'utilisation d'un interpréteur de scripts. Pour ce faire, on crée un script dont l'« interpréteur » est notre programme myecho :


$ cat > script
#!./myecho script-arg
^D
$ chmod +x script

On peut alors utiliser notre programme pour exécuter le script :


$ ./execve ./script
argv[0]: ./myecho
argv[1]: script-arg
argv[2]: ./script
argv[3]: hello
argv[4]: world

chmod(2), execveat(2), fork(2), get_robust_list(2), ptrace(2), exec(3), fexecve(3), getauxval(3), getopt(3), system(3), capabilities(7), credentials(7), environ(7), path_resolution(7), ld.so(8)

Cette page fait partie de la publication 5.13 du projet man-pages Linux. Une description du projet et des instructions pour signaler des anomalies et la dernière version de cette page peuvent être trouvées à l'adresse https://www.kernel.org/doc/man-pages/.

La traduction française de cette page de manuel a été créée par Christophe Blaess https://www.blaess.fr/christophe/, Stéphan Rafin <stephan.rafin@laposte.net>, Thierry Vignaud <tvignaud@mandriva.com>, François Micaux, Alain Portal <aportal@univ-montp2.fr>, Jean-Philippe Guérard <fevrier@tigreraye.org>, Jean-Luc Coulon (f5ibh) <jean-luc.coulon@wanadoo.fr>, Julien Cristau <jcristau@debian.org>, Thomas Huriaux <thomas.huriaux@gmail.com>, Nicolas François <nicolas.francois@centraliens.net>, Florentin Duneau <fduneau@gmail.com>, Simon Paillard <simon.paillard@resel.enst-bretagne.fr>, Denis Barbier <barbier@debian.org>, David Prévot <david@tilapin.org> et Jean-Philippe MENGUAL <jpmengual@debian.org>

Cette traduction est une documentation libre ; veuillez vous reporter à la GNU General Public License version 3 concernant les conditions de copie et de distribution. Il n'y a aucune RESPONSABILITÉ LÉGALE.

Si vous découvrez un bogue dans la traduction de cette page de manuel, veuillez envoyer un message à debian-l10n-french@lists.debian.org.

27 août 2021 Linux