.\" -*- mode: troff; coding: utf-8 -*- .\" Automatically generated by Pod::Man 5.01 (Pod::Simple 3.43) .\" .\" Standard preamble: .\" ======================================================================== .de Sp \" Vertical space (when we can't use .PP) .if t .sp .5v .if n .sp .. .de Vb \" Begin verbatim text .ft CW .nf .ne \\$1 .. .de Ve \" End verbatim text .ft R .fi .. .\" \*(C` and \*(C' are quotes in nroff, nothing in troff, for use with C<>. .ie n \{\ . ds C` "" . ds C' "" 'br\} .el\{\ . ds C` . ds C' 'br\} .\" .\" Escape single quotes in literal strings from groff's Unicode transform. .ie \n(.g .ds Aq \(aq .el .ds Aq ' .\" .\" If the F register is >0, we'll generate index entries on stderr for .\" titles (.TH), headers (.SH), subsections (.SS), items (.Ip), and index .\" entries marked with X<> in POD. Of course, you'll have to process the .\" output yourself in some meaningful fashion. .\" .\" Avoid warning from groff about undefined register 'F'. .de IX .. .nr rF 0 .if \n(.g .if rF .nr rF 1 .if (\n(rF:(\n(.g==0)) \{\ . if \nF \{\ . de IX . tm Index:\\$1\t\\n%\t"\\$2" .. . if !\nF==2 \{\ . nr % 0 . nr F 2 . \} . \} .\} .rr rF .\" ======================================================================== .\" .IX Title "LOCALE::PO4A::TRANSTRACTOR.3PM 1" .TH LOCALE::PO4A::TRANSTRACTOR.3PM 1 2024-06-26 "perl v5.38.2" "User Contributed Perl Documentation" .\" For nroff, turn off justification. Always turn off hyphenation; it makes .\" way too many mistakes in technical documents. .if n .ad l .nh .SH 名称 .IX Header "名称" Locale::Po4a::TransTractor \- 通用翻译提取器。 .SH 描述 .IX Header "描述" Po4a (PO For Anything) 项目的目标是在文档等不需要翻译的领域使用 gettext 工具简化翻译(更有趣的是,简化翻译的维护)。 .PP 这个类是每个 po4a 解析器的祖先,用于解析文档、搜索可翻译字符串、将它们提取到 PO 文件并在输出文档中用它们的翻译替换它们。 .PP 更正式地说,它接受以下参数作为输入: .IP \- 2 要翻译的文档; .IP \- 2 包含要使用的翻译的 PO 文件。 .PP 作为输出,它产生: .IP \- 2 另一个 PO 文件,其结果是从输入文档中提取可翻译字符串; .IP \- 2 翻译的文档,其结构与输入中的文档相同,但所有可翻译字符串都替换为输入中提供的 PO 文件中的翻译。 .PP 以下是这一点的图形表示: .PP .Vb 6 \& 输入文档 \-\-\e /\-\-\-> 输出文档 \& \e / (已翻译) \& +\-> 解析() 函数 \-\-\-\-\-+ \& / \e \& 输入 PO \-\-\-\-\-\-\-\-/ \e\-\-\-> 输出 PO \& (已提取) .Ve .SH 解析器应该重写的函数 .IX Header "解析器应该重写的函数" .IP \fBparse()\fR 4 .IX Item "parse()" 所有工作都在这里进行:解析输入文档、生成输出和提取可翻译字符串。使用下面 \fBINTERNAL FUNCTIONS\fR 章节中提供的函数可以非常简单地实现这一点。另请参阅 \fBSYNOPSIS\fR,它提供了一个示例。 .Sp 此函数由下面的 \fBprocess()\fR 函数调用,但如果您选择使用 \fBnew()\fR 函数,并手动将内容添加到文档中,则必须自己调用此函数。 .IP \fBdocheader()\fR 4 .IX Item "docheader()" 此函数返回我们应该添加到生成的文档中的标题,并将其正确引用为目标语言中的注释。有关它的好处,请参阅 \fBpo4a\fR\|(7) 中的 \fBEducating developers about translations\fR 章节。 .SH 简介 .IX Header "简介" 下面的示例解析以 "

" 开头的段落列表。为简单起见,我们假定文档格式良好,即 "

" 标记是唯一存在的标记,并且该标记位于每个段落的最开始。 .PP .Vb 2 \& sub parse { \& my $self = shift; \& \& PARAGRAPH: while (1) { \& my ($paragraph,$pararef)=("",""); \& my $first=1; \& my ($line,$lref)=$self\->shiftline(); \& while (defined($line)) { \& if ($line =~ m/

/ && !$first\-\-; ) { \& # 这不是我们第一次看到

。 \& # 将当前行重新放入输入, \& # 并将构建的段落输出 \& $self\->unshiftline($line,$lref); \& \& # 现在文档已形成,请翻译它: \& # \- 删除前导标记 \& $paragraph =~ s/^

//s; \& \& # \- 按键输出前导标签(未翻译)和 \& # 段落的其余部分(已翻译) \& $self\->pushline( "

" \& . $self\->translate($paragraph,$pararef) \& ); \& \& next PARAGRAPH; \& } else { \& # 追加到段落后面 \& $paragraph .= $line; \& $pararef = $lref unless(length($pararef)); \& } \& \& # 重新初始化循环 \& ($line,$lref)=$self\->shiftline(); \& } \& # 没有得到定义的行吗?输入文件的结尾。 \& return; \& } \& } .Ve .PP 一旦实现了解析函数,就可以使用下一节中介绍的公共接口来使用 document 类。 .SH 使用解析器的脚本的公共接口 .IX Header "使用解析器的脚本的公共接口" .SS "构造 函数" .IX Subsection "构造 函数" .IP process(%) 4 .IX Item "process(%)" 此函数可以在一次调用中完成处理 po4a 文档所需的所有操作。它的参数必须打包为散列。操作: .RS 4 .IP a. 3 .IX Item "a." 读取 po_in_name 中指定的所有 PO 文件 .IP b. 3 .IX Item "b." 读取在 file_in_name 中指定的所有原始文档 .IP c. 3 .IX Item "c." 解析文档 .IP d. 3 .IX Item "d." 读取并应用所有指定的附录 .IP e. 3 .IX Item "e." 将翻译的文档写入 file_out_name (如果给定) .IP f. 3 .IX Item "f." 将提取的 PO 文件写入 po_out_name (如果给定) .RE .RS 4 .Sp 参数,除了 \fBnew()\fR 接受的参数(具有预期类型): .IP "file_in_name (@)" 4 .IX Item "file_in_name (@)" 我们应该在其中读取输入文档的文件名列表。 .IP "file_in_charset ($)" 4 .IX Item "file_in_charset ($)" Charset used in the input document (if it isn't specified, use UTF\-8). .IP "file_out_name ($)" 4 .IX Item "file_out_name ($)" 我们应该在其中写入输出文档的文件名。 .IP "file_out_charset ($)" 4 .IX Item "file_out_charset ($)" Charset used in the output document (if it isn't specified, use UTF\-8). .IP "po_in_name (@)" 4 .IX Item "po_in_name (@)" 我们应该从中读取输入 PO 文件的文件名列表,其中包含将用于翻译文档的翻译。 .IP "po_out_name ($)" 4 .IX Item "po_out_name ($)" 我们应该在其中写入输出 PO 文件的文件名,其中包含从输入文档提取的字符串。 .IP "addendum (@)" 4 .IX Item "addendum (@)" 我们应该从中读取附录的文件名列表。 .IP "addendum_charset ($)" 4 .IX Item "addendum_charset ($)" 附录的字符集。 .RE .RS 4 .RE .IP new(%) 4 .IX Item "new(%)" 创建新的 po4a 文档。接受的选项 (在作为参数传递的哈希中): .RS 4 .IP "verbose ($)" 4 .IX Item "verbose ($)" 设置详细程度。 .IP "debug ($)" 4 .IX Item "debug ($)" 设置调试。 .IP "wrapcol ($)" 4 .IX Item "wrapcol ($)" The column at which we should wrap text in output document (default: 76). .Sp The negative value means not to wrap lines at all. .RE .RS 4 .Sp Also it accepts next options for underlying Po-files: \fBporefs\fR, \fBcopyright-holder\fR, \fBmsgid-bugs-address\fR, \fBpackage-name\fR, \fBpackage-version\fR, \fBwrap-po\fR. .RE .SS 操作文档文件 .IX Subsection "操作文档文件" .IP read($$$) 4 .IX Item "read($$$)" Add another input document data at the end of the existing array \f(CW\*(C`@{$self\->{TT}{doc_in}}\*(C'\fR. .Sp This function takes two mandatory arguments and an optional one. * The filename to read on disk; * The name to use as filename when building the reference in the PO file; * The charset to use to read that file (UTF\-8 by default) .Sp 此数组 \f(CW\*(C`@{$self\->{TT}{doc_in}}\*(C'\fR 将此输入文档数据保存为。 具有交替含义的字符串数组。 *字符串 \f(CW$textline\fR 保存输入文本数据的每一行。 *字符串 \f(CW\*(C`$filename:$linenum\*(C'\fR 保存其位置并调用为。 "reference" (\f(CW\*(C`linenum\*(C'\fR 从 1 开始)。 .Sp 请注意,它不解析任何内容。当您完成将输入文件打包到文档中时,应该使用 \fBparse()\fR 函数。 .IP write($) 4 .IX Item "write($)" 将翻译后的文档写入给定的文件名。 .Sp 此翻译文档数据由以下人员提供: * \f(CW\*(C`$self\->docheader()\*(C'\fR 保存插件的标题文本,以及。 * \f(CW\*(C`@{$self\->{TT}{doc_out}}\*(C'\fR 保存数组中主翻译文本的每一行。 .SS "操作 PO 文件" .IX Subsection "操作 PO 文件" .IP readpo($) 4 .IX Item "readpo($)" 将文件的内容(该名称作为参数传递)添加到现有输入 PO。旧内容不会丢弃。 .IP writepo($) 4 .IX Item "writepo($)" 将提取的 PO 文件写入给定的文件名。 .IP \fBstats()\fR 4 .IX Item "stats()" 返回到目前为止完成的转换的一些统计信息。请注意,它与 msgfmt \-\-statistic 打印的统计数据不同。在这里,它是关于 PO 文件最近使用情况的统计信息,而 msgfmt 则报告该文件的状态。它是应用于输入 PO 文件的 Locale::Po4a::Po::stats_get 函数的封装。使用示例: .Sp .Vb 1 \& [正常使用 po4a 文档...] \& \& ($percent,$hit,$queries) = $document\->stats(); \& print "我们找到了 $percent\e% ($hit from $queries) 字符串的翻译\en"; .Ve .SS 操作附录 .IX Subsection "操作附录" .IP addendum($) 4 .IX Item "addendum($)" 请参阅 \fBpo4a\fR\|(7),了解有关附录的详细信息,以及翻译人员应如何编写附录。要对翻译后的文档应用附录,只需将其文件名传递给此函数,即可完成 ;) .Sp 此函数在出错时返回非空整数。 .SH 用于编写派生解析器的内部函数 .IX Header "用于编写派生解析器的内部函数" .SS 获取输入,提供输出 .IX Subsection "获取输入,提供输出" 提供了四个函数来获取输入和返回输出。它们与 Perl 的 shift/unshift 和 push/pop 非常相似。 .PP .Vb 4 \& * Perl shift 返回第一个数组项并将其从数组中删除。 \& * Perl unshift 将项作为第一个数组项添加到数组中。 \& * Perl pop 返回最后一个数组项并将其从数组中删除。 \& * Perl push 将一项作为最后一个数组项追加到数组中。 .Ve .PP 第一对是关于输入的,第二对是关于输出的。助记符:在 input 中,您感兴趣的是第一行,shift 提供什么,而在 output 中,您希望将结果添加到末尾,就像 push 一样。 .IP \fBshiftline()\fR 4 .IX Item "shiftline()" 此函数从数组 \f(CW\*(C`@{$self\->{TT}{doc_in}}\*(C'\fR 返回要解析的第一行及其对应的引用 (打包为数组),并删除前两个数组项。这里,引用由字符串 \f(CW\*(C`$filename:$linenum\*(C'\fR 提供。 .IP unshiftline($$) 4 .IX Item "unshiftline($$)" 取消将输入文档的最后移位行及其对应的引用移回 \f(CW\*(C`{$self\->{TT}{doc_in}}\*(C'\fR 的头部。 .IP pushline($) 4 .IX Item "pushline($)" 将新行推到 \f(CW\*(C`{$self\->{TT}{doc_out}}\*(C'\fR 的末尾。 .IP \fBpopline()\fR 4 .IX Item "popline()" 从 \f(CW\*(C`{$self\->{TT}{doc_out}}\*(C'\fR 的末尾弹出最后推送的行。 .SS 将字符串标记为可翻译 .IX Subsection "将字符串标记为可翻译" 提供一个函数来处理应该翻译的文本。 .IP translate($$$) 4 .IX Item "translate($$$)" 必选参数: .RS 4 .IP \- 2 要翻译的字符串 .IP \- 2 此字符串的引用 (即输入文件中的位置) .IP \- 2 此字符串的类型(即对其结构角色的文本描述;在 \fBLocale::Po4a::Po::gettextization()\fR 中使用;另请参阅 \fBpo4a\fR\|(7),\fBGettextization: how does it work?\fR 部分) .RE .RS 4 .Sp 此函数还可以接受一些额外的参数。它们必须组织为散列。例如: .Sp .Vb 2 \& $self\->translate("string","ref","type", \& \*(Aqwrap\*(Aq => 1); .Ve .IP \fBwrap\fR 4 .IX Item "wrap" 指示我们是否可以认为字符串中的空格不重要的布尔值。如果是,则该函数在查找或提取翻译之前对字符串进行规范化,并对翻译进行封装。 .IP \fBwrapcol\fR 4 .IX Item "wrapcol" the column at which we should wrap (default: the value of \fBwrapcol\fR specified during creation of the TransTractor or 76). .Sp The negative value will be substracted from the default. .IP \fBcomment\fR 4 .IX Item "comment" 要添加到条目的额外注释。 .RE .RS 4 .Sp 操作: .IP \- 2 将字符串、引用和类型推送到 po_out。 .IP \- 2 返回字符串的翻译(如 po_in 中所示),以便解析器可以构建 doc_out。 .IP \- 2 在将字符串发送到 po_out 和返回翻译之前,处理字符集以重新编码字符串。 .RE .RS 4 .RE .SS 其他函数 .IX Subsection "其他函数" .IP \fBverbose()\fR 4 .IX Item "verbose()" 返回是否在创建翻译提取器期间传递了 verbose 选项。 .IP \fBdebug()\fR 4 .IX Item "debug()" 返回是否在创建翻译提取器期间传递了调试选项。 .IP \fBget_in_charset()\fR 4 .IX Item "get_in_charset()" This function return the charset that was provided as master charset .IP \fBget_out_charset()\fR 4 .IX Item "get_out_charset()" 此函数将返回应该在输出文档中使用的字符集(通常用于替换已找到的输入文档的检测到的字符集)。 .Sp 它将使用命令行中指定的输出字符集。如果未指定该命令,则将使用输入 PO 的字符集,如果输入 PO 具有默认的 "CHARSET",则返回输入文档的字符集,以便不会执行编码。 .SH 未来方向 .IX Header "未来方向" 当前翻译提取器的一个缺点是它不能处理包含所有语言的翻译文档,如 debconf 模板或 .desktop 文件。 .PP 要解决此问题,只需更改接口: .IP \- 2 将散列作为 po_in_name (每种语言的列表) .IP \- 2 添加要翻译的参数以指示目标语言 .IP \- 2 使用类似映射的语法创建一个 pushline_all 函数,该函数将为所有语言创建其内容的 pushline: .Sp .Vb 3 \& $self\->pushline_all({ "Description[".$langcode."]=". \& $self\->translate($line,$ref,$langcode) \& }); .Ve .PP 看看是否足够 ;) .SH 作者 .IX Header "作者" .Vb 3 \& Denis Barbier \& Martin Quinson (mquinson#debian.org) \& Jordi Vilalta .Ve .SH 翻译 .IX Header "翻译" taotieren