事实上当函数当做值类型并到处传递时, 基本都会使用闭包,如定时器,跨窗口通信,事件监听,ajax等等
基本只要使用了回调函数, 实际上就是在使用闭包。闭包是一把双刃剑 是JavaScript比较难以理解和掌握的部分,
它十分强大,却也有很大的缺陷,如何使用它完全取决于你自己。
在谈闭包之前,我们首先要了解几个概念:
什么是函数表达式? 与函数声明有何不同?
JavaScript查找标识符的机制
JavaScript的作用域是词法作用域
JavaScript的垃圾回收机制
先来说说函数表达式
什么是函数表达式? 如果function是声明中的第一个词,那么就是函数声明,否则就是函数表达式。
举个例子:
var foo = function(){}; //匿名函数表达式 (function foo(){})() //函数表达式,因为function不是声明中的第一个词,前面还有一个“(” function foo(){} //函数声明 |
函数表达式也分匿名函数表达式和具名函数表达式:
var foo = function(){} //匿名函数表达式 var foo = function bar(){} //具名函数表达式 |
具名函数表达式要注意一点:上例中的bar标识符 只在当前的函数作用域中存在,在全局作用域中是不存在的。
函数声明与函数表达式的重要区别有:
函数声明具有函数声明提升,函数表达式不会被提升
函数表达式可以在表达式后跟个括号来立即执行,函数声明不行
(function (){})() //匿名函数表达式,且立即执行 |
这种模式的函数,通常称为IIFE(Immediately Invoked Function Expresstion)代表立即执行函数表达式。
关于函数、变量声明的提升这里就不再多说了, 想了解的同学可以查阅一下相关资料
关于JavaScript执行函数时查找标识符的机制
不了解作用域链及变量对象的同学可以先查阅相关资料后再来看。
作用域链本质上是一个由指向变量对象的指针列表,它只引用但不实际包含变量对象,变量,函数等等都存在各自作用域的变量对象中,通过访问变量对象来访问它们。
只有在函数调用的时候,才会创建执行环境和作用域链,同时每个环境都只能逐级向上搜索作用域链,来查询变量和函数名等标识符。
JavaScript的作用域
JavaScript的作用域就是词法作用域而不是动态作用域
词法作用域最重要的特征是它的定义过程发生在代码的书写阶段
动态作用域的作用域链是基于调用栈的 词法作用域的作用域链是基于代码中的作用域嵌套
function foo(){ console.log(num) } function bar(){ var num = 2; foo(); // 1 } var num = 1; bar(); |
bar函数执行时,会执行foo函数,因为JavaScript是词法作用域,所以函数执行时,会沿着定义时的作用域链查找变量,而不是执行时,foo函数定义在全局中,所以查找到了全局的num,输出了1而不是2。
下面来说闭包
关于什么是闭包,其实有很多种说法,这取决于各自的理解,最主要的有两种:
1. Nicolas C.Zakas:闭包是指有权访问另一个函数作用域中的变量的函数
2.KYLE SIMPSON:当函数可以记住并访问所在的词法作用域时,就产生了闭包,这个函数持有对该词法作用域的引用,这个引用就叫做闭包
我个人更倾向于后者对于闭包的定义,即闭包是一个引用。下面来看一些代码:
function foo() { var a = 5; return function() { console.log(a); } } var bar = foo(); bar(); // 5 |
行时会返回一个匿名函数表达式,这个函数能够访问foo()的作用域,并且引用能引用它,然后将这个匿名函数赋值给了变量bar,让bar能引用这个匿名函数并且可以调用它。
这个例子,匿名函数在自己定义的词法作用域以外的地方成功执行。
这正是闭包强大的地方,比如通过闭包实现模块模式:
function aModule() { var sometext = "module"; function doSomething() { console.log(sometext); } return { doSomething: doSomething }; } var obj = aModule(); obj.doSomething() //module |
我们通过调用aModule函数创建了一个模块实例,函数返回的这个对象,实质上可以看做是这个模块的公告API,是不是有些像其它面向对象语言中的class?
再来通过闭包实现一个单例模式:
var application = function() { var components = []; /* 一些初始化操作 */ return { //公共API getComponentCount: function() { return components.length; }, registerComponent: function(component) { components.push(component); } }; }(); |
这个例子通过IIFE创建了一个单例对象,函数里返回的对象字面量是这个单例模式的公共接口。
通过闭包实现模块模式,可以做到很多强大的事情,模块模式能成功实现,最关键的是返回的API还能继续引用定义时所在的作用域,从而进行一些操作,也就是说,作用域并没有因为函数执行后被销毁,也就是没有被内存回收,之所以没有被回收是因为闭包的存在和JavaScript的垃圾回收机制。
JavaScript的垃圾回收机制
JavaScript最常用的垃圾收集方式是标记清除,垃圾收集器会给存储在内存中的所有变量都加上标记,然后去除环境中的变量,以及被环境中的变量引用的变量的标记,说明这些变量还有作用,暂时不能被删除,然后在此之后被加上标记的变量就是要删除的变量了,等待垃圾收集器对他们完成清除工作。
对函数来说,函数执行完毕后,会自动释放掉里面的变量,可是如果函数内部存在闭包,它们就不会被删除,因为这个函数还在被内部的函数所引用,所以他不会被加上标记,不会被清除,而是会一直存在内存中得不到释放!除非使用闭包的那个内部函数被销毁,外部函数才能得到释放
所以,虽然闭包强大,但是我们不能滥用它,且在没有必要的情况下尽量不要创建闭包,不然将会有大量的变量对象得不到释放,过度占用内存。
关于循环和闭包
当循环和闭包结合在一起时,经常会产生让初学者觉得匪夷所思的问题。来看一段Nicolas C.Zakas
在《JavaScript高级程序设计》中的代码:
function createFunction() { var result = []; for (var i = 0; i < 10; i++) { result[i] = function() { return i; }; } return result; } |
这个函数执行后,会创建一个由十个函数组成的数组,并且产生十个互不相干的函数作用域,表面上看调用第几个函数就会输出几,但是结果并不是这样
var result = createFunction(); result[0](); // 10 result[9](); // 10 |
产生这种奇怪的现象的原因就是之前说的,createFunction的变量对象因为闭包的存在没有被释放,注意闭包保存的是整个变量对象,而不是只保存只被引用的变量,在createFunction执行后,创建了十个函数,同时变量
i 没有被释放,依然保存在内存中,所以此时它的值保留为停止循环后的10。
当我们在外部调用函数时,函数沿着它的作用域链开始搜索所需要的变量,前面说过,JavaScript的作用域链是基于定义时的作用域嵌套,所以当我们调用某个函数比如
result[0] 它就会首先在自己的作用域里通过RSH搜索 i ,显然 i 不存在这个作用域中,于是它又沿着作用域链向上一级作用域中搜索
i ,然后找到了 i ,但是此时createFunction函数已经执行,循环也已经执行完毕了, i 的值为10,所以获取到的i,值就为10,同理,其他的函数执行时,查找的i
也会是10, 所以每个函数执行结果都是输出10。
关键所在就是尽管循环中的十个函数是在各自的迭代中分别定义的,但是它们都处于一个共享的上一级作用域中,所以它们获取到的都是一个
i
所以解决此类问题的关键就是让函数查找i时,不找到createFunction的变量对象那一级 ,因为一旦向上搜索到createFunction那里,得到的就是10。所以我们可以通过一些方法在中间来截断本该搜索到createFunction变量对象的一次查找。
首先我们可以这样:
function createFunction() { var result = []; for (var i = 0; i < 10; i++) { (function (){ result[i] = function() { return i; };})(); } return result; } |
我们通过定义一个立即执行函数表达式,在result[i]函数上一级创建了一个块级作用域,如果我们把这个块级作用域叫做a,那么它查找i时是这样一条链
result[i]->a->createFunction,之所以还会查找到createFunction中,是因为a中没有i这个变量,所以我们需要做些什么,让它搜索到a时就停下
function createFunctions() { var result = new Array(); for (var i = 0; i < 10; i++) { (function(i){ result[i] = function() { return i; };})(i); } return result; } |
现在a这个块级作用域里定义了一个变量 i ,这个 i 与上级的 i 不会互相影响,因为它们存在各自的作用域里, 同时我们将该次迭代时的 i 值赋给了
a这个块级作用域里的 i ,即a中的 i 保存了当次迭代的 i ,result[i]在外部执行时,是这样的调用链result
i -> a在a中就能找到需要的变量,不需要再向上搜索,也不会查找到值为10的 i ,所以调用哪个result[i]函数,就会输出哪个
i 。
在 ES6 中我们还可以使用 let 来解决此类问题
function createFunction() { var result = []; for (var i = 0; i < 10; i++) { let j = i; result[i] = function() { return j; }; } return result; } //输出一下 console.log(createFunction()[2]()); //2 |
let会创建一个块级作用域,并在这个作用域中声明一个变量。所以我们相当于在result[i]上套了一层块级作用域
function createFunction() { var result = []; for (var i = 0; i < 10; i++) { //块的开始 let j = i; result[i] = function() { return j; }; //块的结束 } return result; } |
这种方式解决此类问题,与前面没有多大分别,总之就是为了不让函数调用时去查找到最上级的那个 i 。
其实,如果在for循环头部来进行let声明还会有一个有趣的行为:
function createFunction() { var result = []; for (let i = 0; i < 10; i++) { //每次迭代,都会声明一次i,总共声明10次 result[i] = function() { return i; }; } return result; } console.log(createFunction()[2]()); //2 |
这样在for头部使用let声明, 每次迭代都会进行声明,随后每次迭代都会使用上一个迭代结束时的值来初始化这个变量。
事实上当函数当做值类型并到处传递时, 基本都会使用闭包,如定时器,跨窗口通信,事件监听,ajax等等
基本只要使用了回调函数, 实际上就是在使用闭包。
闭包是一把双刃剑 是JavaScript比较难以理解和掌握的部分, 它十分强大,却也有很大的缺陷,如何使用它完全取决于你自己。
以上皆为个人观点 如若有误 还望指正。
|