浅析PHP原理之变量分离/引用(Variables Separation)

   2015-11-07 0
核心提示:以下小编就为大家介绍一下PHP中变量分离和引用的概念。需要的朋友可以过来参考下

首先我们回顾一下zval的结构:

复制代码 代码如下:

struct _zval_struct {
        /* Variable information */
        zvalue_value value; /* value */
        zend_uint refcount;
        zend_uchar type; /* active type */
        zend_uchar is_ref;
};

其中的refcount和is_ref字段我们一直都没有介绍过,我们知道PHP是一个长时间运行的服务器端的脚本解释器。那么对于它来说,效率和资源占用率是一个很重要的衡量标准,也就是说,PHP必须尽量介绍内存占用率,考虑下面这段代码:
复制代码 代码如下:

<?php
   $var = "laruence";
   $var_dup = $var;
   unset($var);
?>

第一行代码创建了一个字符串变量,申请了一个大小为9字节的内存,保存了字符串”laruence”和一个NULL(/0)的结尾。
第二行定义了一个新的字符串变量,并将变量var的值”复制”给这个新的变量。
第三行unset了变量var
这样的代码在我们平时的脚本中是很常见的,如果PHP对于每一个变量赋值都重新分配内存,copy数据的话,那么上面的这段代码公要申请18个字节的内存空间,而我们也很容易的看出来,上面的代码其实根本没有必要申请俩份空间,呵呵,PHP的开发者也看出来了:
我们之前讲过,PHP中的变量是用一个存储在symbol_table中的符号名,对应一个zval来实现的,比如对于上面的第一行代码,会在symbol_table中存储一个值”var”, 对应的有一个指针指向一个zval结构,变量值”laruence”保存在这个zval中,所以不难想象,对于上面的代码来说,我们完全可以让”var”和”var_dup”对应的指针都指向同一个zval就可以了。
PHP也是这样做的,这个时候就需要介绍我们之前一直没有介绍过的zval结构中的refcount字段了。
refcount,顾名思义,记录了当前的zval被引用的计数。
比如对于代码:
复制代码 代码如下:

<?php
   $var = 1;
   $var_dup = $var;
?>

第一行,创建了一个整形变量,变量值是1。 此时保存整形1的这个zval的refcount为1。
第二行,创建了一个新的整形变量,变量也指向刚才创建的zval,并将这个zval的refcount加1,此时这个zval的refcount为2。
PHP提供了一个函数可以帮助我们了解这个过程debug_zval_dump:
复制代码 代码如下:

<?php
 $var = 1;
 debug_zval_dump($var);
 $var_dup = $var;
 debug_zval_dump($var);
?>

输出:
long(1) refcount(2)
long(1) refcount(3


如果你奇怪 ,var的refcount应该是1啊?
我们知道,对于简单变量,PHP是以传值的形式穿参数的。也就是说,当执行debug_zval_dump($var)的时候,$var会以传值的方式传递给debug_zval_dump,也就是会导致var的refcount加1,所以我们只要能看到,当变量赋值给一个变量以后,能导致zval的refcount加1这个事实即可。
现在我们回头看文章开头的代码, 当执行了最后一行unset($var)以后,会发生什么呢? 对,既是refcount减1,上代码:
复制代码 代码如下:

<?php
   $var = "laruence";
   $var_dup = $var;
   unset($var);
   debug_zval_dump($var_dup);
?>

输出:
string(8) "laruence" refcount(2


但是,对于下面的代码呢?
复制代码 代码如下:

<?php
   $var = "laruence";
   $var_dup = $var;
   $var = 1;
?>

很明显在这段代码执行以后,$var_dup的值应该还是”laruence”, 那么这又是怎么实现的呢?
这就是PHP的copy on write机制:
PHP在修改一个变量以前,会首先查看这个变量的refcount,如果refcount大于1,PHP就会执行一个分离的例程, 对于上面的代码,当执行到第三行的时候,PHP发现$var指向的zval的refcount大于1,那么PHP就会复制一个新的zval出来,将原zval的refcount减1,并修改symbol_table,使得$var和$var_dup分离(Separation)。这个机制就是所谓的copy on write(写时复制)。
上代码测试:
复制代码 代码如下:

<?php
   $var = "laruence";
   $var_dup = $var;
   $var = 1;
   debug_zval_dump($var);
   debug_zval_dump($var_dup);
?>

输出:
long(1) refcount(2)
string(8) "laruence" refcount(2


现在我们知道,当使用变量复制的时候 ,PHP内部并不是真正的复制,而是采用指向相同的结构来尽量节约开销。那么,对于PHP中的引用,那又是如何实现呢?
复制代码 代码如下:

<?php
   $var = "laruence";
   $var_ref = &$var;
   $var_ref = 1;
?>

这段代码结束以后,$var也会被间接的修改为1,这个过程称作(change on write:写时改变)。那么ZE是怎么知道,这次的复制是不需要Separation的呢?
这个时候就要用到zval中的is_ref字段了:
对于上面的代码,当第二行执行以后,$var所代表的zval的refcount变为2,并且同时置is_ref为1。
到第三行的时候,PHP先检查var_ref代表的zval的is_ref字段,如果为1,则不分离,大体逻辑示意如下:
复制代码 代码如下:

 if((*val)->is_ref || (*val)->refcount<2){
          //不执行Separation
        ... ;//process
  }

但是,问题又来了,对于如下的代码,又会怎样呢?
复制代码 代码如下:

<?php
   $var = "laruence";
   $var_dup = $var;
   $var_ref = &$var;
?>

对于上面的代码,存在一对copy on write的变量$var和$var_dup, 又有一对change on write机制的变量对$var和$var_ref,这个情况又是如何运作的呢?
当第二行执行的时候,和前面讲过的一样,$var_dup 和 $var 指向相同的zval, refcount为2.
当执行第三行的时候,PHP发现要操作的zval的refcount大于1,则,PHP会执行Separation, 将$var_dup分离出去,并将$var和$var_ref做change on write关联。也就是,refcount=2, is_ref=1;
基于这样的分析,我们就可以让debug_zval_dump出refcount为1的结果来:
复制代码 代码如下:

<?php
     $var = "laruence";
    $var_dup = &$var;
     debug_zval_dump($var);
?>

输出:
string(8) "laruence" refcount(1


详细原因,读者你只要稍加分析就能得出,我就不越俎代庖了。;)
这次我们介绍了PHP的变量分离机制,下次我会继续介绍如果在扩展中接收和传出PHP脚本中的参数。

 
标签: 变量 分离 引用
反对 0举报 0 评论 0
 

免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

  • 拓端tecdat|R语言逻辑回归分析连续变量和分类变量之间的“相关性“
    拓端tecdat|R语言逻辑回归分析连续变量和分类变
    原文链接:http://tecdat.cn/?p=18169 比如说分类变量为是否幸存、是因变量,连续变量为年龄、是自变量,这两者可以做相关分析吗?两者又是否可以做回归分析?我们考虑泰坦尼克号数据集,   titanic = titanic[!is.na(titanic$Age),] attach(titanic) 
    03-08
  • Win10—rust语言安装与环境变量配置(+VSCode)
    Win10—rust语言安装与环境变量配置(+VSCode)
    (只记录了必须要内容,日后完善!)1. rust的安装与环境变量:要提前把下面两个环境变量配置好,这样是为了指定安装路径。否则会默认安装在 C 盘下。CARGO_HOME:D:\Program Files\RUST\.cargoRUSTUP_HOME:D:\Program Files\RUST\.rustup然后,在这个:https:
    02-09
  • 诗歌rails之常见的ruby内部变量 ruby和ruby on
    在ruby程序中,经常会看到一些以$开头的变量,这些不是指我们自己在程序中设置的全局变量,而是指系统内部已经设置好的变量,他们代表了一些特定的意思,下面搜集了一些常用的内部变量,用一些简单的代码说明他们代表的意思:局部域:在某一个线程作用域内才
    02-09
  • php 判断一个变量是否是合法的json
    1.场景api验证前端json 类型字段合法性2.分析官网3.解决function json_validate($string) {if (is_string($string)) {@json_decode($string);return (json_last_error() === JSON_ERROR_NONE);}return false;} 
    02-09
  • PerfView专题 (第八篇):洞察 C# 内存泄漏之寻找静态变量名和GC模式
    PerfView专题 (第八篇):洞察 C# 内存泄漏之寻
    一:背景这篇我们来聊一下 PerfView 在协助 WinDbg 分析 Dump 过程中的两个超实用技巧,可能会帮助我们快速定位最后的问题,主要有如下两块:洞察内存泄漏中的静态大集合变量名。验证当前程序的 GC 模式。这里就把经验分享一下,希望让大家少走弯路。二:如何
    02-09
  • 小程序 拼接变量名后取值
     let obj = {obj1 :{say:'hi1'},obj2 :{say:'hi2'}} let one = "obj1" let two = "say"// 等于 obj.obj1.say // `` 是ESC下 TAB上的哪个键 console.log( obj[`${one}`][`${two}`] ) // 输出hi1 this.setData({ [`obj.a.b.c`] : 'value
    02-09
  • :数据类型、变量、可变性、常量、隐藏">Rust <
    rust 是强类型语言,所有变量、常量都必须有明确的数据类型;很多情况下,省略类型声明,编译器可自动推导,但不是所有情况下都会成功。rust 有整型、浮点型、布尔型、字符型、数组、元组、枚举、结构体等数据结构,其中:整型有:i8、i16、i32、i64、isize、
    02-09
  • rust变量与可变性 rust 全局变量
    fn main() {//let x = 5;let mut x = 5;//通过const定义常量名称要大写,并且值不可更改const Y:i32=6;println!("Y is {}",Y);println!("The value of x is {}", x);x = 6;println!("The value of x is {}", x);//如果要覆盖上一个变量 需要使用let//如果不是
    02-09
  • Rust: 变量
    变量的概念来源于数学,在计算机语言中,它是数据存取的基本单位。在 Rust 中,变量有很多不同于其他语言的地方,今天就来简单介绍一下。变量声明直接看下面代码:fn main() {// 使用let关键字声明一个变量let a = 1;// 也可以附带类型信息let b: i32 = 3;pri
    02-09
  • [Rust] 变量的属性: 不可变(immutable), 可变(m
    变量的可变性在 Rust 中, 变量可以具有下面的属性。immutable: 不可变变量mutable: 可变变量shadowing: 重定义(遮蔽)一个变量const: 常量static: 静态变量不可变变量(immutable) vs 可变变量(mut)Rust 的安全哲学要求变量默认是不可变的。fn main() {// 定义
    02-09
点击排行