PERLFORM(7) Perl Programmers Reference Guide PERLFORM(7)

perlform - Perl 格式

Perl的一些內部機制、可以幫助我們產生一份簡單的格式化圖表。經過perl的處理,你列印的格式可以接近於你所見的外貌。它可以記錄如你現在正處在哪個頁面,每個頁面的行數與何時列印出頁面的標題。關鍵字,format() 格式函式與write()執行函式是直接引自FORTRAN語法。詳情可參閱 perlfunc。幸運的是列印的格式可讀性又有所提高。幾乎類似BASIC 的PRINT USING。可以把它想象為簡單的 nroff(1).

有如子程式與包一樣,格式只是語句的宣告,而不是執行呼叫。故它可以放在程式的任何位置(一般最好是把它們集中在一塊)。與perl的其它變數名字型別不同, 格式命名有別於一般的獨自的定義。也就是說,你有一個名為Foo的函式,它與另一個格式名稱為Foo的東西是完全不同。但是預設的格式名稱與有關連的檔案控制代碼可用相同的名字。所以預設的輸出格式名稱STDOUT,它的檔案控制代碼名稱就是STDOUT。而對預設格式名稱TEMP,它的檔案控制代碼名稱也可以是TEMP。雖然名稱一樣但兩者並不相同。

輸出格式的語法如下:

format NAME =
FORMLIST
.

如省略格式名稱,格式名稱將以標準輸出STDOUT命名。而格式專案將包括了好幾個連續橫行。每一行屬於下列叄種型態之一:

1.
註釋(comment), 以符號“#”置於每行的開頭。
2.
圖案行(picture line),規定了單一行的格式化外觀。
3.
引數行, 提供一些數值以對應前面的圖案行。

圖案行的輸出效果就與我們看到的一樣,除了某些值域欄位會給相對應數值取代外,每個輸入欄位都以一個@或 ^ 控制符開頭。這些單行內的控制符不能做任何竄改取代(勿與陣列變數@混淆)。@欄位是屬於正常形態的欄位,而^欄位則用來表示可以輸入多行文字。至於該欄位則由< > 或 ⎪ 符號跟隨其後指定向左、右、或居中對齊。並同時跟據該符號的數目,輸入指定資料的長度。如變數內容超過限定長度、格式列印時會自動刪除多餘的部份。

另一種指定向右對齊方式,是使用#符號來指定一個數字欄位。如此可方便小數點定位。如果輸入值裡還包含一個換行字元(0,則僅列印出該換行字元前的資料。最後圖案行出現的@*這個特別符號標記,可以用來列印多行並且不被截掉的數值。

接下來的一行、是跟據圖案行裡的值域欄位輸入相應的數值。如果是利用運算式提供數值的話、必須以逗號分隔。因為所有的表示法都會被當成一個串連內容再行處理。所以一個單一的串列表示法也可產生多個串列資料。如果表示法是利用括號圍起,可能會展開好幾行。若想如是安排,第一行的第一個單字必須是以左括號開始。如果運算式內有小數點的數字型別須要處理、同時圖案行的相關符號也指出小數位須列印出來(除了圖案行內的包含小數點"."的數字控制符號#外)。小數點列印出的外貌, 以當地的執行版本決定(LC_NUMERIC locale)。也就是說、在德文地區使用小數格示輸出時、小數點的顯示將是","而非"."。相關資料請參考 perllocale 與 "警告"

圖案行裡的欄位如果以^控制符開頭、格式將會作特殊化處理。如果該欄位是註解欄位又沒定義其值、欄位將以空白取代。若是其它型態、則視為一種填補資料的狀態。 在此、我們不能隨便填入任意表示法進去。相反、必須以相關的變數輸入字串內容。perl會盡量將文字放入該欄位、然後把字串的前面部份刪去。當你下次使用該字串變數時、可以使用後面的字串部份(換句話說、在執行write函式時、字串變數的內容是會改變的)。正常情況下、你必須使用一類似垂直狀的堆塊來放置要輸入的文字、以便整齊列印出一柱狀文字。如你列印的文字太長、想以"..."取代過長的文字時、你可以藉由更改 $: 變數值來取代分隔字元。也就是當你使用ENGLISH模組時的 $FORMAT_LINE_BREAK_CHARACTERS的意思。

使用^符號欄位可產生不定長度的記錄欄位。如果要列印的文字很短、你想壓縮掉文字後的空白、請在想壓縮掉的空白地方加上一個"~"控制符號。如果重複使用兩個"~"符號、則該行會被重複列印、直到該欄位的所有文字列印完畢為止 (如你同時使用"@"值域欄位的話、切記每次要輸入不同的數值)。

列印格示標題的預設處理方法、是將正使用的格式名稱後加上_TOP字樣既可。其內容將會列印至每頁的開頭部份。請參考 perlfunc/write 函式

例如:

# a report on the /etc/passwd file
format STDOUT_TOP =
                        Passwd File
Name                Login    Office   Uid   Gid Home
------------------------------------------------------------------
.
format STDOUT =
@<<<<<<<<<<<<<<<<<< @⎪⎪⎪⎪⎪⎪⎪ @<<<<<<@>>>> @>>>> @<<<<<<<<<<<<<<<<<
$name,              $login,  $office,$uid,$gid, $home
.
# a report from a bug report form
format STDOUT_TOP =
                        Bug Reports
@<<<<<<<<<<<<<<<<<<<<<<<     @⎪⎪⎪         @>>>>>>>>>>>>>>>>>>>>>>>
$system,                      $%,         $date
------------------------------------------------------------------
.
format STDOUT =
Subject: @<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
         $subject
Index: @<<<<<<<<<<<<<<<<<<<<<<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
       $index,                       $description
Priority: @<<<<<<<<<< Date: @<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
          $priority,        $date,   $description
From: @<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
      $from,                         $description
Assigned to: @<<<<<<<<<<<<<<<<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
             $programmer,            $description
~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                     $description
~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                     $description
~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                     $description
~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                     $description
~                                    ^<<<<<<<<<<<<<<<<<<<<<<<...
                                     $description
.

我們也有可能在同一個輸出管道同時使用print 與 write函式。但使用時、必須修改$-的特殊內建變數值(使用English模組的話、則是使用$FORMAT_LINES-LEFT變數)。

Format Variables 格式變數

當前的格式名稱一向都是存放於$~這個特殊變數內($FORMAT_NAME),而每頁的開頭格式則存放在$^($FORMAT-TOP_NAME),輸出頁為$%($FORMAT_PAGE_NUMBER),每頁行數是$= ($FORMAT_LINE_PER_PAGE),自動輸出格式是放在$⎪($OUTPUT_AUTOFLUSH)、要輸出到每頁開頭部份的字串存放在$^L ($FORMAT-FORMFEED)。這些變數的有效範圍,都是以某一個檔案控制代碼為單元。因此、你必須呼叫select()函式來呼叫適當的檔案控制代碼來改變變數內容。

select((select(OUTF),
        $~ = "My_Other_Format",
        $^ = "My_Top_Format"
       )[0]);

難看吧!這就是一般用法。如此一來、你至少可用臨是變數來存放前一個檔案控制代碼。事實上、這已是較好的作法,除了可讀性提高外、也提供你一個位置暫停程式的執行,方變你一次到位除錯。

$ofh = select(OUTF);
$~ = "My_Other_Format";
$^ = "My_Top_Format";
select($ofh);

如果你使用English模組,你甚至可以輸入英文變數名稱

use English '-no_match_vars';
$ofh = select(OUTF);
$FORMAT_NAME     = "My_Other_Format";
$FORMAT_TOP_NAME = "My_Top_Format";
select($ofh);

但你還是要呼叫select()函式。因此我們建議你用FileHandle模組。現在你可用小寫英文字母的格式名稱來處理這些特殊變數。

use FileHandle;
format_name     OUTF "My_Other_Format";
format_top_name OUTF "My_Top_Format";

好多了吧!

因為數值行的內容可能保括任何的表示法 (我們指的是 @ 欄位而非 ^ 欄位)。因此你可使用其它函式、建立更加複雜的處理方法。好像使用 printf 函式、或自己定義的函式。列如:

format Ident =
    @<<<<<<<<<<<<<<<
    &commify($n)
.

在欄位輸入真正的@ 或^符號:

format Ident =
I have an @ here.
        "@"
.

將整行字置中對齊:

format Ident =
@⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪
        "Some text line"
.

我們並無任何內建的方法讓你指定如、某個欄位要對齊該頁面最右等諸如此類事項。但你仍然能列印出你想要的格式。跟據目前頁面直行數目,呼叫eval()函式來處理它:

$format  = "format STDOUT = \n"
         . '^' . '<' x $cols . "\n"
         . '$entry' . "\n"
         . "\t^" . "<" x ($cols-8) . "~~\n"
         . '$entry' . "\n"
         . ".\n";
print $format if $Debugging;
eval $format;
die $@ if $@;

它可能列印出下列格式外貌:

format STDOUT =
^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
$entry
        ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<~~
$entry
.

下面是一個有點類似fmt(1)的小程式:

format =
^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ~~
$_
.
$/ = '';
while (<>) {
    s/\s*\n\s*/ /g;
    write;
}

Footers 頁尾

雖然我們有$FORMAT_TOP_NAME來記錄每頁開頭部份的格式,卻沒有一個相對應的方法來自動指定每頁的底部格式。問題是、我們並不知到某個格式資料可能會多大,除非你真的去執行它。這是我們將來要處理的重點之一。

這是一個暫時的應用方案 如果你有一個固定大小的頁尾、你可在每次呼叫write函式前檢查變數$FORMAT_LINES_LEFT,然後自行印出該資料。

還有一個方法,就是開啟一個管道。呼叫open(MYSELF,”⎪-”) (參考 perlfunc/open() 函式)。並呼叫write函式把資料輸往MYSELF、而不是標準輸出STDOUT。然後利用子串列的標準輸入、來重新處理每頁開頭或結尾所要附加的資料部份。這雖不方便,但還是可辦到的。

Accessing Formatting Internals 格式處理的核心

至於低階格式的機制,你可呼叫formlin()函式直接處理$^A變數($ACCUMUNATOR)。

例如:

$str = formline <<'END', 1,2,3;
@<<<  @⎪⎪⎪  @>>>
END
print "Wow, I just stored `$^A' in the accumulator!\n";

或是設計一個子程式swrite()。它對於 write 的腳色相當於sprint 對於 print。

use Carp;
sub swrite {
    croak "usage: swrite PICTURE ARGS" unless @_;
    my $format = shift;
    $^A = "";
    formline($format,@_);
    return $^A;
}
   $string = swrite(<<'END', 1, 2, 3);
Check me out
@<<<  @⎪⎪⎪  @>>>
END
   print $string;

不當處理顯示結束格示內容的點運算子號、有時也會同時影響你的網路的電郵功能(跟據過往經驗、錯誤是必然而不能避免)。如果使用電郵輸出格式內容、你應先處理好結束格式點運算子位置。切勿放置於左邊界、以免被SMTP截去。

區域性變數(引用”my”定義變數)、在呼叫格式化輸出時不會被察覺。除非在使用區域性變數的串程內另行定義(5.001版本前並沒有區域性變數一詞)。

格式輸出是 perl 語言裡維一受制於程式設計使用地區的部分。如果當前的使用地區使用LC_NUMERIC,那小數點符號的格式化輸出必以當地方式顯示。perl 不會理會當地的所須格式,除非你呼叫了 use locale。但格式列印又不受控於use locale。因為locale 它只在使用的塊內有效。同時跟據歷史原因、格式的作用域不僅包括在塊內。進一步詳情參閱 perllocale 本地化文件。

格式輸出時、程式串內的空白符號0,相當於一個空白單元。所以你可以想像格式列印相當於先處理變數:

$value =~ tr/\n\t\f/ /;

除非圖案行已定義、餘下的空白符號 將強制性另印新行。

中文版維護人

小高 <you@email.com>

中文版最新更新

2001年12月9日星期日

中文手冊頁翻譯計劃

http://cmpp.linuxforum.net

本頁面中文版由中文 man 手冊頁計劃提供。
中文 man 手冊頁計劃:https://github.com/man-pages-zh/manpages-zh

2003-11-25 perl v5.8.3