深入理解Perl变量作用域

发布时间:2020-05-05编辑:脚本学堂
深入理解Perl变量作用域

英文版原文出自:http://perl.plover.com/FAQs/Namespaces.html.en
由Chinaunix的 仙子 翻译 出处: http://bbs.chinaunix.net/viewthread.php?tid=612342

变量作用域
(一)包变量
$x = 1
这里,$x是个包变量。关于包变量,有2件重要的事情要了解:
1)假如没有其他申明,变量就是包变量;
2)包变量总是全局的。

全局意味着包变量在每个程序里总可访问到。在你定义了$x=1后,程序的任何其他部分,甚至在其他文件里定义的子程序,都能影响和修改$x的值。这点毫无例外;包变量总是全局的。

包变量被归类到族(叫做packages)。每个包变量的名字包括2部分。这2部分类似于变量自己的名字和族名。假如喜欢,你可以称呼美国副总统为 'AL',但对其全名'Al Gore'来讲,这确实太短。类似的,$x有一个全名,其形式如$main::x。主要部分是包限定词,类似于'Al Gore'里的'Gore'部分。Al Gore和AL Capone是不同的人,尽管他们都叫做'AL'。同样的,$Gore::Al和$Capone::Al是不同的变量,$main::x and $DBI::x也是不同的变量。

允许指定变量名的包部分,假如这样做,perl会明确知道你指的是哪个变量。但为简洁起见,通常不会指定变量的包限定词。

1.当前包
假如你仅说$x,perl假设你指的是当前包里的变量$x。什么是当前包?通常情况下是指main,但你可以改变当前包,在程序里这样写:
package Mypackage;

从这点开始,当前包就是Mypackage。当前包做的唯一事情是,在你没有指定包名时,它影响对包变量的解释。假如当前包是Mypackage,这时$x实际指$Mypackage::x。假如当前包是main,这时$x实际指$main::x。

假如你在编写一个模块,假设模块名称是MyModule,你可能会将如下行放在模块文件的顶部:
package MyModule;

从这里开始,你在模块文件里使用的所有包变量将位于包MyModule里,你可以非常放心,这些变量不会与程序其他部分的变量冲突。不必担心你和DBI的作者是否会使用同一个变量$x,因为变量会被区分开,一个是$MyModule::x,另一个是$DBI::x。

记 住包变量总是全局的。即使你不在DBI包里,甚至即使你从来没听说过DBI包,也没什么能阻止你读取或写入$DBI::errstr。你不必做任何特殊事 情。$DBI::errstr象所有包变量一样,是个全局变量,它可全局访问到;你要做的唯一事是用全名来获取它。甚至可以这样写:
package DBI;
$errstr = 'Ha ha Tim!';
这样就修改了$DBI::errstr。

2.关于包变量的补充

1)若包名为空,则等同于main。所以对任何x来讲,$::x等同于$main::x。
2) 某些变量总是强迫位于main包里。例如,假如你提及%ENV,perl假设你指%main::ENV,即使当前包不是main。假如你想要% Fred::ENV,就必须明确申明,即使当前包是Fred。其他特殊的变量包括INC,所有的单标点符号变量名例如$_,$$, @ARGV,以及STDIN, STDOUT, 和STDERR。
3)包名,而非变量名,可以包含::。你可以命名变量 为$DBD::Oracle::x。这意味着变量x位于包DBD::Oracle里;它与包DBD没有任何关系。Isaac Newton与 Olivia Newton-John无关,并且Newton::Isaac也与Newton::John::Olivia无关。尽管它们看起来都以Newton开头, 但实际上这有点欺骗性。Newton::John::Olivia位于Newton::John包里,而不是Newton里。
这是你要了解的关于包变量的所有东西。
包变量是全局的,这意味着它是危险的,因为不能保证某个人不会在背后来破坏它们。在Perl 4之前,所有的变量都是包变量,这点令人不安。所以perl 5增加了新的非全局变量。

(二)词法变量
Perl 里其他类型的变量叫做词法变量或私有变量,因为它们是私有的。它们有时也叫做my变量,因为总是以my来申明它们。你也许很想叫它们local变量,因为 它们的影响被局限在程序的一小部分里。但不要那样做,因为其他人可能以为你在谈论perl的local操作符。当你想要一个local变量时,请想到 my,而不是local。
my $x;
如上申明创建了一个新变量,叫做x,它对程序的大部分完全不可访问,大部分是指在申明变量的代码块之外的地方。这个块叫做变量作用域。假如变量未在任何块里申明,它的作用域就是从申明它的地方开始,到文件的结尾。

也可以申明和初始化一个my变量,这样写:
 

复制代码 代码如下:
my $x = 119;

也能同时申明几个变量:
 

复制代码 代码如下:
my ($x, $y, $z, @args) = (5, 23, @_);

如下示例展示私有变量在哪里会很有用。考虑这个子程序:
 

复制代码 代码如下:
  sub print_report {
    @employee_list = @_;
    foreach $employee (@employee_list) {
$salary = lookup_salary($employee);
print_partial_report($employee, $salary);
    }
  }

假 如lookup_salary碰巧也使用了名为$employee的变量,这个变量名和print_report使用的一样,事情就会变得糟糕。负责 print_report和lookup_salary的2个程序员必须协作,以确保他们不使用相同的变量名。这点是痛苦的。事实上,即使是在一个中等大 小的项目里,这点也令人无法忍受。

解决方法:使用my变量:
 

复制代码 代码如下:
  sub print_report {
    my @employee_list = @_;
    foreach my $employee (@employee_list) {
my $salary = lookup_salary($employee);
print_partial_report($employee, $salary);
    }
  }

my @employee_list创建一个新的数组变量,它在print_report函数之外完全不可访问。 my $employee创建一个标量变量,它在foreach循环外完全不可访问。你不必担心程序里的其他函数会破坏这些变量,因为它们没这个能力;它们不知 道这些变量在哪里,因为变量的名字在my申明的作用域之外有不同的意义。my变量有时也叫做词法变量,因为它们的作用域仅仅依赖于程序文本自身,不依赖于 执行细节,例如以什么顺序来执行什么。仅通过检查源代码,就可以弄清楚它们的作用域。无论何时你看到一个变量,请在同一代码块里的先前位置找my申明。假 如找到了,你可以确认该变量在代码块之外不可访问。假如在最内层的代码块里没有找到my声明,那就到上一层块里找,依此类推,直到找到为止。假如任何地方 都没有my申明,那么这个变量是个包变量。

my变量并非包变量。它们不是包的一部分,并且没有包限定词。当前包不会因为变量的解释方式而受到影响。如下是个例子:
 

复制代码 代码如下:

my $x = 17;

  package A;
  $x = 12;

  package B;
  $x = 20;

  # $x is now 20.
  # $A::x and $B::x are still undefined

在顶部的my $x=17的申明创建了一个新的名为x的词法变量,它的作用域持续到文件结尾。$x的新意义覆盖了默认的意义,默认意义是指$x是当前包的一个包变量。
package A改变了当前包,但因为$x指向了词法变量,而不是包变量,$x=12不会对$A::x有任何影响。类似的,在package B后,$x=20修改了词法变量,而不是任何包变量。
在文件结尾,词法变量$x值为20,包变量$main::x, $A::x, 和$B::x仍未定义。假如要使用它们,仍须通过全名来访问它们。

必须记住的是:
包变量是全局变量。
对私有变量,必须使用my申明。

1. local和my
几乎每个人都知道,有个local函数,它对本地变量有些影响。它到底是什么呢,与my有关系吗?答案简单而奇怪:
my创建本地变量,然而local不这样。

首先,local $x实际做的事是:它存储包变量$x的当前值在一个安全的地方,然后用一个新值替换它,假如没有指定新值,就使用undef代替。当控制离开当前块时,它 也会恢复$x的旧值。它影响的是包变量,这个包变量获取了本地值。但包变量总是全局的,local申明的包变量亦无例外。为了显示其区别,请看这个:
 

复制代码 代码如下:

  $lo = 'global';
  $m  = 'global';
  A();

  sub A {
    local $lo = 'AAA';
    my    $m  = 'AAA';
    B();
  }

  sub B {
    print "B ", ($lo eq 'AAA' ? 'can' : 'cannot') ,
    " see the value of lo set by A.n";

    print "B ", ($m  eq 'AAA' ? 'can' : 'cannot') ,
    " see the value of m  set by A.n";
  }

结果会打印:
  B can see the value of lo set by A.
  B cannot see the value of m  set by A.

发生了什么?在A函数里的local申明,给包变量$lo赋予了一个新的临时值AAA。旧值global会被存储起来,直到A返回,但在这点之前,A调用了B。B访问$lo的内容没有问题,因为$lo是包变量,包变量总是全局可见的,所以它能见到A设置的AAA值。

与之对照的是,my申明创建了一个新的词法作用域的变量叫做$x,它仅仅在A函数里可见。在A之外,$m保留它的旧意义:它指向包变量$m;其值仍是global。这是B所见到的变量。它不会见到AAA值,因为那个变量是个词法变量,仅仅存在于A里。