.\" -*- coding: UTF-8 -*- .ie t .ds dg \(dg .el .ds dg (!) '\" t .\" Copyright 1992-1994, Henry Spencer .\" Copyright, the authors of the Linux man-pages project .\" .\" %%%LICENSE_START(MISC) .\" This software is not subject to any license of the American Telephone .\" and Telegraph Company or of the Regents of the University of California. .\" .\" Permission is granted to anyone to use this software for any purpose .\" on any computer system, and to alter it and redistribute it, subject .\" to the following restrictions: .\" .\" 1. The author is not responsible for the consequences of use of this .\" software, no matter how awful, even if they arise from flaws in it. .\" .\" 2. The origin of this software must not be misrepresented, either by .\" explicit claim or by omission. Since few users ever read sources, .\" credits must appear in the documentation. .\" .\" 3. Altered versions must be plainly marked as such, and must not be .\" misrepresented as being the original software. Since few users .\" ever read sources, credits must appear in the documentation. .\" .\" 4. This notice may not be removed or altered. .\" %%%LICENSE_END .\" .\"******************************************************************* .\" .\" This file was generated with po4a. Translate the source file. .\" .\"******************************************************************* .TH regex 7 "8 فبراير 2026" "صفحات دليل لينكس 6.18" .SH الاسم regex \- تعابير POSIX.2 القياسية .SH الوصف تأتي التعابير القياسية ("RE"s)، كما عُرّفت في POSIX.2، في شكلين: التعابير القياسية الحديثة (وهي تقريباً تلك الخاصة بـ \fBegrep\fP(1)؛ ويسميها POSIX.2 التعابير "الموسعة") والتعابير القياسية المهجورة (وهي تقريباً تلك الخاصة بـ \fBed\fP(1)؛ ويسميها POSIX.2 التعابير "الأساسية"). توجد التعابير المهجورة غالباً للتوافقية مع البرامج القديمة؛ وسيُناقش أمرها في النهاية. يترك معيار POSIX.2 بعض جوانب بناء جملة التعابير القياسية ودلالاتها مفتوحة؛ وتحدد العلامة "\*(dg" القرارات المتعلقة بهذه الجوانب التي قد لا تكون قابلة للنقل بالكامل إلى تطبيقات POSIX.2 الأخرى. .P التعبير القياسي (الحديث) هو \fIفرع\fP واحد\*(dg أو أكثر من الفروع غير الفارغة\*(dg، يفصل بينها \[aq]|\[aq]. وهو يطابق أي شيء يطابق أحد هذه الفروع. .P الفرع هو \fIقطعة\fP واحدة\*(dg أو أكثر، متسلسلة. وهو يطابق مطابقة للقطعة الأولى، تليها مطابقة للثانية، وهكذا. .P القطعة هي \fIذرة\fP قد يتبعها رمز واحد\*(dg هو \[aq]*\[aq] أو \[aq]+\[aq] أو \[aq]?\[aq] أو \fIقيد\fP. الذرة المتبوعة بـ \[aq]*\[aq] تطابق \fIتسلسلاً\fP من 0 أو أكثر من مطابقات تلك الذرة. والذرة المتبوعة بـ \[aq]+\[aq] تطابق تسلسلاً من 1 أو أكثر من مطابقات تلك الذرة. والذرة المتبوعة بـ \[aq]?\[aq] تطابق تسلسلاً من 0 أو 1 من مطابقات الذرة. .P \fIالقيد\fP هو \[aq]{\[aq] يليه عدد صحيح عشري غير موقع، يليه اختيارياً \[aq],\[aq] ثم يليه اختيارياً عدد صحيح عشري آخر غير موقع، وينتهي دائماً بـ \[aq]}\[aq]. يجب أن تقع الأعداد الصحيحة بين 0 و \fBRE_DUP_MAX\fP (255\*(dg) شمولاً، وإذا وُجد عددان، فلا يجوز أن يتجاوز الأول الثاني. الذرة المتبوعة بقيد يحتوي على عدد صحيح واحد \fIi\fP وبدون فاصلة تطابق تسلسلاً من \fIi\fP من مطابقات الذرة بالضبط. والذرة المتبوعة بقيد يحتوي على عدد صحيح واحد \fIi\fP وفاصلة تطابق تسلسلاً من \fIi\fP أو أكثر من مطابقات الذرة. والذرة المتبوعة بقيد يحتوي على عددين صحيحين \fIi\fP و \fIj\fP تطابق تسلسلاً من \fIi\fP إلى \fIj\fP (شمولاً) من مطابقات الذرة. .P الذرة هي تعبير قياسي محصور بين \[dq]\fI()\fP\[dq] (تطابق ما يطابقه التعبير القياسي)، أو مجموعة فارغة من \[dq]\fI()\fP\[dq] (تطابق السلسلة الفارغة)\*(dg، أو \fIتعبير بين حاصرتين\fP (انظر أدناه)، أو \[aq].\[aq] (تطابق أي محرف مفرد)، أو \[aq]\[ha]\[aq] (تطابق السلسلة الفارغة في بداية السطر)، أو \[aq]$\[aq] (تطابق السلسلة الفارغة في نهاية السطر)، أو \[aq]\[rs]\[aq] متبوعاً بأحد المحارف \[dq]\fI\[ha].[$()|*+?{\[rs]\fP\[dq] (تطابق ذلك المحرف بوصفه محرفاً عادياً)، أو \[aq]\[rs]\[aq] متبوعاً بأي محرف آخر\*(dg (تطابق ذلك المحرف بوصفه محرفاً عادياً، كما لو أن \[aq]\[rs]\[aq] لم تكن موجودة\*(dg)، أو محرف مفرد ليس له أهمية أخرى (يطابق ذلك المحرف). رمز \[aq]{\[aq] متبوعاً بمحرف غير الرقم هو محرف عادي، وليس بداية قيد\*(dg. من غير القانوني إنهاء تعبير قياسي بـ \[aq]\[rs]\[aq]. .P \fIالتعبير بين حاصرتين\fP هو قائمة من المحارف محصورة بين \[dq]\fI[]\fP\[dq]. وهو يطابق عادةً أي محرف مفرد من القائمة (ولكن انظر أدناه). إذا بدأت القائمة بـ \[aq]\[ha]\[aq]، فإنها تطابق أي محرف مفرد \fIليس\fP من بقية القائمة. إذا فُصل بين محرفين في القائمة بواسطة \[aq]\-\[aq]، فهذا اختصار \fIلنطاق\fP كامل من المحارف بين هذين الاثنين (شمولاً) في \fIتسلسل\fP الترتيب، على سبيل المثال، \[dq]\fI[0\-9]\fP\[dq] في ASCII يطابق أي رقم عشري. من غير القانوني\*(dg اشتراك نطاقين في نقطة نهاية، مثلاً \[dq]\fIa\-c\-e\fP\[dq]. تعتمد النطاقات اعتماداً كبيراً على تسلسل الترتيب، ويجب على البرامج القابلة للنقل تجنب الاعتماد عليها. .P لتضمين المحرف \[aq]]\[aq] حرفياً في القائمة، اجعله المحرف الأول (بعد \[aq]\[ha]\[aq] المحتملة). ولتضمين \[aq]\-\[aq] حرفياً، اجعله المحرف الأول أو الأخير، أو نقطة النهاية الثانية لنطاق. لاستخدام \[aq]\-\[aq] حرفياً كنقطة نهاية أولى لنطاق، احصره بين \[dq]\fI[.\fP\[dq] و \[dq]\fI.]\fP\[dq] لجعله عنصر ترتيب (انظر أدناه). باستثناء هذه وبعض المجموعات التي تستخدم \[aq][\[aq] (انظر الفقرات التالية)، تفقد جميع المحارف الخاصة الأخرى، بما في ذلك \[aq]\[rs]\[aq]، أهميتها الخاصة داخل التعبير بين حاصرتين. .P داخل التعبير بين حاصرتين، عنصر الترتيب (محرف، أو \fIتسلسل\fP متعدد المحارف يُرتب كأنه محرف واحد، أو اسم تسلسل ترتيب لأي منهما) محصور بين \[dq]\fI[.\fP\[dq] و \[dq]\fI.]\fP\[dq] يمثل تسلسل المحارف لذلك العنصر. التسلسل هو عنصر واحد في قائمة التعبير بين حاصرتين. وبذلك يمكن للتعبير بين حاصرتين الذي يحتوي على عنصر ترتيب متعدد المحارف أن يطابق أكثر من محرف واحد، فمثلاً إذا كان تسلسل الترتيب يتضمن عنصر الترتيب "ch"، فإن التعبير القياسي \[dq]\fI[[.ch.]]*c\fP\[dq] يطابق أول خمسة محارف من "chchcc". .P داخل التعبير بين حاصرتين، عنصر الترتيب المحصور بين \[dq]\fI[=\fP\[dq] و \[dq]\fI=]\fP\[dq] هو فئة تكافؤ، تمثل تسلسلات المحارف لجميع عناصر الترتيب المكافئة لهذا العنصر، بما في ذلك نفسه. (إذا لم تكن هناك عناصر ترتيب مكافئة أخرى، يُعامل كما لو كانت المحددات المحيطة هي \[dq]\fI[.\fP\[dq] و \[dq]\fI.]\fP\[dq]). على سبيل المثال، إذا كان o و \(^o عضوين في فئة تكافؤ، فإن \[dq]\fI[[=o=]]\fP\[dq] و \[dq]\fI[[=\(^o=]]\fP\[dq] و \[dq]\fI[o\(^o]\fP\[dq] كلها مترادفة. قد لا تكون فئة التكافؤ\*(dg نقطة نهاية لنطاق. .P داخل التعبير بين حاصرتين، اسم \fIفئة المحارف\fP المحصور بين \[dq]\fI[:\fP\[dq] و \[dq]\fI:]\fP\[dq] يمثل قائمة بجميع المحارف المنتمية لتلك الفئة. أسماء فئات المحارف القياسية هي: .P .RS .TS l l l. alnum digit punct alpha graph space blank lower upper cntrl print xdigit .TE .RE .P .\" As per http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=295666 .\" The following does not seem to apply in the glibc implementation .\" .P .\" There are two special cases\*(dg of bracket expressions: .\" the bracket expressions .\" .RI \[dq] [[:<:]] \[dq] .\" and .\" .RI \[dq] [[:>:]] \[dq] .\" match the null string at the beginning and end of a word respectively. .\" A word is defined as a sequence of .\" word characters .\" which is neither preceded nor followed by .\" word characters. .\" A word character is an .\" .I alnum .\" character (as defined by .\" .BR wctype (3)) .\" or an underscore. .\" This is an extension, .\" compatible with but not specified by POSIX.2, .\" and should be used with .\" caution in software intended to be portable to other systems. تمثل هذه فئات المحارف المعرفة في \fBwctype\fP(3). قد توفر المجموعات المحلية غيرها. لا يجوز استخدام فئة محارف كنقطة نهاية لنطاق. .P في حال كان بإمكان التعبير القياسي مطابقة أكثر من سلسلة فرعية لسلسلة معطاة، فإن التعبير يطابق السلسلة التي تبدأ أولاً في السلسلة. إذا أمكن للتعبير مطابقة أكثر من سلسلة فرعية تبدأ من تلك النقطة، فإنه يطابق الأطول. تطابق التعابير الفرعية أيضاً أطول سلاسل فرعية ممكنة، بشرط أن تكون المطابقة الكلية أطول ما يمكن، مع إعطاء الأولوية للتعابير الفرعية التي تبدأ مبكراً في التعبير القياسي على تلك التي تبدأ لاحقاً. لاحظ أن التعابير الفرعية ذات المستوى الأعلى تأخذ الأولوية على التعابير الفرعية المكونة لها ذات المستوى الأدنى. .P تُقاس أطوال المطابقة بالمحارف، وليس بعناصر الترتيب. تُعتبر السلسلة الفارغة أطول من عدم وجود مطابقة على الإطلاق. على سبيل المثال، \[dq]\fIbb*\fP\[dq] يطابق المحارف الثلاثة الوسطى من "abbbc"، و \[dq]\fI(wee|week)(knights|nights)\fP\[dq] يطابق جميع المحارف العشرة لـ "weeknights"، وعند مطابقة \[dq]\fI(.*).*\fP\[dq] مقابل "abc" يطابق التعبير الفرعي بين قوسين المحارف الثلاثة جميعها، وعند مطابقة \[dq]\fI(a*)*\fP\[dq] مقابل "bc" يطابق كل من التعبير القياسي الكلي والتعبير الفرعي بين قوسين السلسلة الفارغة. .P إذا حُددت مطابقة غير حساسة لحالة الأحرف، يكون التأثير كما لو أن جميع الفروق بين حالات الأحرف قد اختفت من الأبجدية. عندما يظهر حرف أبجدي موجود في حالات متعددة كمحرف عادي خارج التعبير بين حاصرتين، فإنه يُحول فعلياً إلى تعبير بين حاصرتين يحتوي على كلتا الحالتين، مثلاً، \[aq]x\[aq] يصبح \[dq]\fI[xX]\fP\[dq]. وعندما يظهر داخل تعبير بين حاصرتين، تُضاف جميع نظائره من الحالات الأخرى إلى التعبير، بحيث يصبح \[dq]\fI[x]\fP\[dq] مثلاً \[dq]\fI[xX]\fP\[dq] ويصبح \[dq]\fI[\[ha]x]\fP\[dq] هو \[dq]\fI[\[ha]xX]\fP\[dq]. .P لا يفرض أي حد معين على طول التعابير القياسية\*(dg. يجب ألا تستخدم البرامج التي يُراد لها أن تكون قابلة للنقل تعابير قياسية أطول من 256 بايت، حيث يمكن للتطبيق رفض قبول هذه التعابير مع البقاء متوافقاً مع معيار POSIX. .P تختلف التعابير القياسية المهجورة ("الأساسية") في عدة جوانب. المحارف \[aq]|\[aq] و \[aq]+\[aq] و \[aq]?\[aq] هي محارف عادية ولا يوجد معادل لوظائفها. محددات القيود هي \[dq]\fI\[rs]{\fP\[dq] و \[dq]\fI\[rs]}\fP\[dq]، مع كون \[aq]{\[aq] و \[aq]}\[aq] بمفردهما محارف عادية. الأقواس للتعابير الفرعية المتداخلة هي \[dq]\fI\[rs](\fP\[dq] و \[dq]\fI\[rs])\fP\[dq]، مع كون \[aq](\[aq] و \[aq])\[aq] بمفردهما محارف عادية. \[aq]\[ha]\[aq] هو محرف عادي إلا في بداية التعبير القياسي أو\*(dg بداية تعبير فرعي بين قوسين، و \[aq]$\[aq] هو محرف عادي إلا في نهاية التعبير القياسي أو\*(dg نهاية تعبير فرعي بين قوسين، و \[aq]*\[aq] هو محرف عادي إذا ظهر في بداية التعبير القياسي أو بداية تعبير فرعي بين قوسين (بعد \[aq]\[ha]\[aq] بادئة محتملة). .P أخيراً، هناك نوع رئيس جديد من الذرات، وهو \fIالمرجع الخلفي\fP: المحرف \[aq]\[rs]\[aq] متبوعاً برقم عشري غير صفري \fId\fP يطابق نفس \fIتسلسل\fP المحارف الذي طابقه التعبير الفرعي المرقّم بـ \fId\fP بين قوسين (تُرقم التعابير الفرعية حسب مواقع أقواس الفتح الخاصة بها، من اليسار إلى اليمين)، بحيث يطابق مثلاً \[dq]\fI\[rs]([bc]\[rs])\[rs]1\fP\[dq] سلسلة "bb" أو "cc" ولكن ليس "bc". .SH العلل وجود نوعين من التعابير القياسية هو عمل رديء. .P تقول مواصفات POSIX.2 الحالية أن \[aq])\[aq] هو محرف عادي في غياب \[aq](\[aq] غير متطابقة؛ كان هذا نتيجة غير مقصودة لخطأ في الصياغة، ومن المرجح أن يتغير. تجنب الاعتماد عليه. .P المراجع الخلفية هي عمل رديء للغاية، وتسبب مشاكل كبيرة للتطبيقات الفعالة. كما أنها معرفة بشيء من الغموض (هل يطابق \[dq]\fIa\[rs](\[rs](b\[rs])*\[rs]2\[rs])*d\fP\[dq] سلسلة "abbbd"؟). تجنب استخدامها. .P .\" As per http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=295666 .\" The following does not seem to apply in the glibc implementation .\" .P .\" The syntax for word boundaries is incredibly ugly. توصيف POSIX.2 للمطابقة غير الحساسة لحالة الأحرف غامض. تعريف "حالة واحدة تعني كل الحالات" المذكور أعلاه هو الإجماع الحالي بين المطورين حول التفسير الصحيح. .SH المؤلف .\" In order to comply with `credits must appear in the documentation' .\" I added an AUTHOR paragraph - aeb. .\" Sigh... The page license means we must have the author's name .\" in the formatted output. أُخذت هذه الصفحة من حزمة regex الخاصة بهنري سبنسر. .SH "انظر أيضًا" \fBgrep\fP(1)، \fBregex\fP(3) .P معيار POSIX.2، القسم 2.8 (ترميز التعبير القياسي). .PP .SH ترجمة تُرجمت هذه الصفحة من الدليل بواسطة زايد السعيدي . .PP هذه الترجمة هي وثيقة مجانية؛ راجع .UR https://www.gnu.org/licenses/gpl-3.0.html رخصة جنو العامة الإصدار 3 .UE أو ما بعده للاطلاع على شروط حقوق النشر. لا توجد أي ضمانات. .PP إذا وجدت أي أخطاء في ترجمة صفحة الدليل هذه، يرجى إرسال بريد إلكتروني إلى قائمة بريد المترجمين: .MT kde-l10n-ar@kde.org .ME .