本文介绍ES6新标准中对函数的扩展。节选自《ESMAScript 6 入门 —— 阮一峰》)
一、函数参数的默认值
1. 基本用法
ES6之前,不能直接为函数的参数指定默认值,只能采用变通的方法。
1 | function log(x, y) { |
上面代码检查函数log
的参数y
有没有赋值,如果没有,则指定默认值为World
。这种写法的缺点在于,如果参数y
赋值了,但是对应的布尔值为false
,则该赋值不起作用。就像上面代码的最后一行,参数y
等于空字符,结果被改为默认值。
为了避免这个问题,通常需要先判断一下参数y
是否被赋值,如果没有,再等于默认值。
1 | if (typeof y === 'undefined') { |
ES6允许为函数的参数设置默认值,即直接写在参数定义的后面。
1 | function log(x, y = 'World') { |
可以看到,ES6的写法比ES5简洁许多,而且非常自然。下面是另一个例子。
1 | function Point(x = 0, y = 0) { |
除了简洁,ES6的写法还有两个好处:首先,阅读代码的人,可以立刻意识到哪些参数是可以省略的,不用查看函数体或文档;其次,有利于将来的代码优化,即使未来的版本在对外接口中,彻底拿掉这个参数,也不会导致以前的代码无法运行。
参数变量是默认声明的,所以不能用let
或const
再次声明。
1 | function foo(x = 5) { |
上面代码中,参数变量x
是默认声明的,在函数体中,不能用let
或const
再次声明,否则会报错。
使用参数默认值时,函数不能有同名参数。
1 | // 不报错 |
另外,一个容易忽略的地方是,参数默认值不是传值的,而是每次都重新计算默认值表达式的值。也就是说,参数默认值是惰性求值的。
1 | let x = 99; |
上面代码中,参数p
的默认值是x + 1
。这时,每次调用函数foo
,都会重新计算x + 1
,而不是默认p
等于100。
2. 与解构赋值默认值结合使用
参数默认值可以与解构赋值的默认值,结合起来使用。
1 | function foo({x, y = 5}) { |
上面代码只使用了对象的解构赋值默认值,没有使用函数参数的默认值。只有当函数foo
的参数是一个对象时,变量x
和y
才会通过解构赋值生成。如果函数foo
调用时没有提供参数,变量x
和y
就不会生成,从而报错。通过提供函数参数的默认值,就可以避免这种情况。
1 | function foo({x, y = 5} = {}) { |
上面代码指定,如果没有提供参数,函数foo
的参数默认为一个空对象。
下面是另一个解构赋值默认值的例子。
1 | function fetch(url, {body = '', method = 'get', headers = {}}) { |
上面代码中,如果函数fetch
的第二个参数是一个对象,就可以为它的三个属性设置默认值。这种写法不能省略第二个擦拭农户,如果结合函数参数的默认值,就可以省略第二个参数。这时,就出现了双重默认值。
1 | function fetch(url, {body = '', method = 'get', headers = {}} = {}) { |
上面代码中,函数fetch
没有第二个参数时,函数参数的默认值就会生效,然后才是解构赋值的默认值生效,变量method
才会取到默认值get
。
作为练习,请问下面两种写法有什么差别?
1 | // 写法一 |
上面两种写法都对函数的参数设定了默认值,区别是写法一函数参数的默认值是空对象,但是设置了对象解构赋值的默认值;写法二函数参数的默认值是一个有具体属性的对象,但是没有设置对象解构赋值的默认值。
1 | // 函数没有参数的情况 |
3. 参数默认值的位置
通常情况下,定义了默认值的参数,应该是函数的尾参数。因为这样比较容易看出来,到底省略了哪些参数。如果非尾部的参数设置默认值,实际上这个参数是没法省略的。
1 | // 例一 |
上面代码中,有默认值的参数都不是尾参数。这时,无法只省略该参数,而不省略它后面的参数,除非显式输入undefined
。
如果传入undefined
,将触发该参数等于默认值,null
则没有这个效果。
1 | function foo(x = 5, y = 6) { |
上面代码中,x
参数对应undefined
,结果触发了默认值,y
参数等于null
,就没有触发默认值。
4. 函数的length属性
指定了默认值以后,函数的length
属性,将返回没有指定默认值的参数个数。也就是说,指定了默认值后,length
属性将失真。
1 | (function (a) {}).length // 1 |
上面代码中,length
属性的返回值,等于函数的参数个数减去指定了默认值的参数个数。比如,上面最后一个函数,定义了3个参数,其中有一个参数c
指定了默认值,因此length
属性等于3
减去1
,最后得到2
。
这是因为length
属性的含义是,该函数预期传入的参数个数。某个参数指定默认值以后,预期传入的参数个数就不包括这个参数了。同理,后文的rest参数也不会计入length
属性。
1 | (function(...args) {}).length // 0 |
如果设置了默认值的参数不是尾参数,那么length
属性也不再计入后面的参数了。
1 | (function (a = 0, b, c) {}).length // 0 |
5. 作用域
一旦设置了参数的默认值,函数进行声明初始化时,参数会形成一个单独的作用域(context)。等到初始化结束,这个作用域就会消失。这种语法行为,在不设置参数默认值时,是不会出现的。
1 | var x = 1; |
上面代码中,参数y
的默认值等于变量x
。调用函数f
时,参数形成一个单独的作用域。在这个作用域里面,默认值变量x
指向第一个参数x
,而不是全局变量x
,所以输出是2
。
再看下面的例子。
1 | let x = 1; |
上面代码中,函数f
调用时,参数y = x
形成一个单独的作用域。这个作用域里面,变量x
本身没有定义,所以指向外层的全局变量x
。函数调用时,函数体内部的局部变量x
影响不到默认值变量x
。
如果此时,全局变量x
不存在,就会报错。
1 | function f(y = x) { |
下面这样写,也会报错。
1 | var x = 1; |
上面代码中,参数x = x
形成一个单独的作用域。实际执行的是let x = x
,由于暂时性死区的原因,这行代码会报错“x未定义”。
如果参数的默认值是一个函数,该函数的作用域也遵守这个规则。
1 | let foo = 'outer'; |
上面代码中,函数bar
的参数func
的默认值是一个匿名函数,返回值是变量foo
。函数参数形成的单独作用域里面,并没有定义变量foo
,所以foo
指向外层的全局变量foo
,因此输出outer
。
如果写成下面这样,就会报错。
1 | function bar(func = () => foo) { |
上面代码中,匿名函数里面的foo
指向函数外层,但是函数外层并没有声明变量foo
,所以就报错了。
下面是一个更复杂的例子。
1 | var x = 1; |
上面代码中,函数foo
的参数形成了一个单独作用域。这个作用域里面,首先声明了变量x
,然后声明了变量y
,y
的默认值是一个匿名函数。这个匿名函数内部的变量x
,指向同一个作用域的第一个参数x
。函数foo
内部又声明了一个内部变量x
,该变量与第一个参数x
由于不是同一个作用域,所以不是同一个变量,因此执行y
后,内部变量x
和外部全局变量x
的值都没变。
如果将var x = 3
的var
去除,函数foo
的内部变量就指向第一个参数x
,与匿名函数内部的x
是一致的,所以最后输出的就是2
,而外层的全局变量x
依然不受影响。
1 | var x = 1; |
6. 应用
利用参数默认值,可以指定某一个参数不得省略,如果省略就抛出一个错误。
1 | function throwIfMissing() { |
上面代码的foo
函数,如果调用的时候没有参数,就会调用默认值throwIfMissing
函数,从而抛出一个错误。
从上面代码还可以看到,参数mustBeProvided
的默认值等于throwIfMissing
函数的运行结果(注意函数名throwIfMissing
之后有一对圆括号),这表明参数的默认值不是在定义时执行,而是在运行时执行。如果参数已经赋值,默认值中的函数就不会运行。
另外,可以将参数默认值设为undefined
,表明这个参数是可以省略的。
1 | function foo(optional = undefined) { ... } |
二、rest参数
ES6引入rest参数(形式为...变量名
),用于获取函数的多于参数,这样就不需要使用arguments
对象了。rest参数搭配的变量是一个数组,该变量将多余的参数放入数组中。
1 | function add(...values) { |
上面代码的add
函数是一个求和函数,利用rest参数,可以向该函数传入任意数目的参数。
下面是一个rest参数代替arguments
变量的例子。
1 | // arguments变量的写法 |
上面代码的两种写法,比较后可以发现,rest参数的写法更自然也更简洁。
arguments
对象不是数组,而是一个类数组对象,所以为了使用数组的方法,必须使用Array.prototype.slice.call
先将其转为数组。rest参数就不存在这个问题,它就是一个真正的数组,数组特有的方法都可以使用。下面是一个利用rest参数改写数组push
方法的例子。
1 | function push(array, ...item) { |
注意,rest参数之后不能再有其他参数(即只能是最后一个参数),否则会报错。
1 | // 报错 |
函数的length
属性,不包括rest参数
1 | (function(a) {}).length // 1 |
三、严格模式
从ES5开始,函数内部可以设定为严格模式。
1 | function doSomething(a, b) { |
ES2016做了一点修改,规定只要函数参数使用了默认值、解构赋值、或者扩展运算符,那么函数内部就不能显式设定为严格模式,否则会报错。
1 | // 报错 |
这样规定的原因是,函数内部的严格模式,同时适用于函数体和函数参数。但是,函数执行的时候,先执行函数参数,然后再执行函数体。这样就有一个不合理的地方,只有从函数体之中,才能直到参数是否应该以严格模式执行,但是参数却应该先于函数体执行。
1 | // 报错 |
上面代码中,参数value
的默认值是八进制数070
,但是严格模式下不能使用前缀0
表示八进制,所以应该报错。但是实际上,JavaScript引擎会先成功执行value = 070
,然后进入函数体内部,发现需要用严格模式执行,这时才会报错。
虽然可以先解析函数体代码,再执行参数代码,但是这样无疑就增加了复杂性。因此,标准索性禁止了这种用法,只要参数使用了默认值、解构赋值、或者扩展运算符,就不能显式指定严格模式。
两种方法可以规避这种限制。第一种是设定全局性的严格模式,这是合法的。
1 |
|
第二种是把函数包在一个无参数的立即执行函数里面
1 | const doSomething = (function() { |
四、name属性
函数的name
属性,返回该函数的函数名。
1 | function foo() {} |
这个属性早就被浏览器广泛支持,但是直到ES6,才将其写入了标准。
需要注意的是,ES6对这个属性的行为做出了一些修改。如果讲一个匿名函数赋值给一个变量,ES5的name
属性,会返回空字符串,而ES6的name属性将会返回实际的函数名。
1 | var f = function() {} |
上面代码中,变量f
等于一个匿名函数,ES5和ES6的name
属性返回的值不一样。
如果将一个具名函数赋值给一个变量,则ES5和ES6的name
属性都返回这个具名函数原本的名字。
1 | const bar = function baz() {}; |
Function
构造函数返回的函数实例,name
属性的值为anonymous
。
1 | (new Function).name // 'anonymous' |
bind
返回的函数,name
属性值会加上bound
前缀。
1 | function foo() {}; |
五、箭头函数
1. 基本用法
ES6允许使用“箭头”(=>
)定义函数。
1 | var f = v => v; |
如果箭头函数不需要参数或者需要多个参数,就是用一个圆括号代表参数部分。
1 | var f = () => 5; |
如果箭头函数的代码块部分多于一条语句,就要使用大括号将它们括起来,并且使用return
语句返回。
1 | var sum = (num1, num2) => { return num1 + num2; } |
由于大括号被解释为代码块,所以如果箭头函数直接返回一个对象,必须在对象外面加上括号,否则会报错。
1 | // 报错 |
下面是一种特殊情况,虽然可以运行,但是会得到错误的结果。
1 | let foo = () => {a: 1}; |
上面代码中,原示意图是返回一个对象{a: 1}
,但是由于引擎认为大括号是代码块,所以执行了一行语句a: 1
。这时,a
可以被解释为语句的标签,因此实际执行的语句是1;
,然后函数就结束了,没有返回值。
如果箭头函数只有一行语句,且不需要返回值,可以采用下面的写法,就不用写大括号了。
1 | let fn = () => void dosNotReturn(); |
箭头函数可以与变量结构结合使用。
1 | const full = ({first, second}) => first + ' ' + second; |
箭头函数使得表达式更加简洁。
1 | const isEven = n => n % 2 == 0; |
上面代码只用了两行,就定义了两个简单的工具函数。如果不用箭头函数,可能就要占用多行,而且还不如现在这样写醒目。
箭头函数的一个用处是简化回调函数。
1 | // 正常函数写法 |
另一个例子是
1 | // 正常函数写法 |
下面是rest参数与箭头函数结合的例子。
1 | const numbers = (...nums) => nums; |
2. 使用注意点
箭头函数有几个使用注意点。
1) 函数体内的
this
对象,就是定义时所在的对象,而不是使用时所在的对象。2) 不可以当作构造函数,也就是说,不可以使用
new
命令,否则会抛出一个错误。3) 不可以使用
arguments
对象,该对象在函数体内不存在。如果要用,可以用rest参数代替。4) 不可以使用
yield
命令,因此箭头函数不能用作Generator函数。
上面四点中,第一点尤其值得注意。this
对象的指向是可变的,但是在箭头函数中,它是固定的。
1 | function foo() { |
上面代码中,setTimeout
的参数是一个箭头函数,这个箭头函数的定义生效是在foo
函数生成时,而它的真正执行要等到100毫秒以后。如果是普通函数,执行时this
应该指向全局对象window
,这时应该输出21
。但是,箭头函数导致this
总是指向函数定义生效时所在的对象(本例是{id: 42}
),所以输出的是42
。
箭头函数可以让setTimeout
里面的this
,绑定定义时所在的作用域,而不是指向运行时所在的作用域。下面是另一个例子。
1 | function Timer() { |
上面代码中,Timer
函数内部设置了两个定时器,分别使用了箭头函数和普通函数。前者的this
绑定定义时所在的作用域(即Timer
函数),后者的this
指向运行时所在的作用域(即全局对象)。所以,3100毫秒以后,timer.s1
被更新了3次,而timer.s2
一次都没更新。
箭头函数可以让this
指向固定化,这种特性很有利于封装回调函数。下面是一个例子,DOM事件的回调函数被封装在一个对象里面。
1 | var handler = { |
上面代码的init
方法中,使用了箭头函数,这导致这个箭头函数里面的this
,总是指向handler
对象。否则,回调函数运行时,this.doSomething
这一行会报错,因为此时this
指向document
对象。
this
指向的固定化,并不是因为箭头函数内部有绑定this
的机制,实际原因是箭头函数根本没有自己的this
,导致内部的this
就是外层代码的this
。正是因为它没有this
,所以也就不能用作构造函数。
所以,箭头函数转成ES5的代码如下。
1 | // ES6 |
上面代码中,转换后的ES5版本清楚地说明了,箭头函数里面根本没有自己的this
,而是引用外层的this
。
请问下面的代码之中有几个this
?
1 | function foo() { |
上面代码中,只有一个this
,就是函数foo
的this
,所以t1
、t2
、t3
都输出同样的结果。因为所有的内层函数都是箭头函数,都没有自己的this
,它们的this
其实都是最外层foo
函数的this
。
除了this
,以下三个变量在箭头函数中也是不存在的,指向外层函数的对应变量:arguments
、super
、new.target
。
1 | function foo() { |
上面代码中,箭头函数内部的变量arguments
,其实是函数foo
的arguments
变量。
另外,由于箭头函数没有自己的this
,所以当然也就不能用call()
、apply()
、bind()
这些方法去改变this
的指向。
1 | (function() { |
上面代码中,箭头函数没有自己的this
,所以bind
方法无效,内部的this
指向外部的this
。
长期以来,JavaScript语言的this
对象一直是一个令人头疼的问题,在对象方法中使用this
,必须非常小心。箭头函数“绑定”this
,很大程度上解决了这个困扰。
3. 嵌套的箭头函数
箭头函数内部,还可以再使用箭头函数。下面是一个ES5语法的多重嵌套。
1 | function insert(value) { |
上面这个函数,可以使用箭头函数改写。
1 | let insert = (value) => ({into: (array) => ({after: (afterValue) => { |
下面是一个部署管道机制(pipeline)的例子,即前一个函数的输出是最后一个函数的输入。
1 | const pipeline = (...funcs) => |
如果觉得上面的写法可读性比较差,也可以采用下面的写法。
1 | const plus1 = a => a + 1; |
六、双冒号运算符
箭头函数可以绑定this
对象,大大减少了显式绑定this
对象的写法(call
、apply
、bind
)。但是,箭头函数并不适用于所有场合,所以现在有一个提案,提出了“函数绑定”(function bind)运算符,用来取代call
、apply
、bind
调用。
函数绑定运算符是并排的两个冒号(::
),双冒号左边是一个对象,右边是一个函数。该运算符会自动将左边的对象,作为上下文环境(即this
对象),绑定到右边的函数上面。
1 | foo::bar; |
如果双冒号左边为空,右边是一个对象的方法,则等于将该方法绑定到该对象上面。
1 | var method = obj::obj.foo; |
如果双冒号运算符的运算结果,还是一个对象,就可以采用链式写法。
1 | import {map, takeWhile, forEach} from 'iterlib'; |
七、尾调用优化
1. 什么是尾调用
尾调用(Tail Call)是函数式编程的一个重要概念,本身非常简单,一句话就能说清楚,就是指某个函数的最后一步是调用另一个函数。
1 | function f(x) { |
上面代码中,函数f
的最后一步是调用函数g
,这就叫尾调用。
以下三种情况,都不属于尾调用。
1 | // 情况一 |
上面代码中,情况一是调用函数g
之后,还有赋值操作,所以不属于尾调用,即使语义完全一样。情况二也属于调用后还有操作,即使写在一行内。情况三等同于下面的代码。
1 | function f(x) { |
尾调用不一定出现在函数尾部,只要是最后一部操作即可。
1 | function f(x) { |
上面代码中,函数m
和n
都属于尾调用,因为它们都是函数f
的最后一步操作。
2. 尾调用优化
尾调用之所以与其他调用不同,就在于它的特殊的调用位置。
我们知道,函数调用会在内存形成一个“调用记录”,又称“调用帧”(call frame),保存调用位置和内部变量等信息。如果在函数A
的内部调用函数B
,那么在A
的调用帧上方,还会形成一个B
的调用帧。等到B
运行结束,将结果返回到A
,B
的调用帧才会消失。如果函数B
内部还调用函数C
,那就还有一个C
的调用帧。所有的调用帧,就形成一个“调用栈”(call stack)。
尾调用由于是函数的最后一步操作,所以不需要保留外层函数的调用帧,因为调用位置、内部变量等信息都不会再用到了,只要直接用内层函数的调用帧,取代外层函数的调用帧就可以了。
1 | function f() { |
上面代码中,如果函数g
不是尾调用,函数f
就需要保存内部变量m
和n
的值、g
的调用位置等信息。但由于调用g
之后,函数f
就结束了,所以执行到最后一步,完全可以删除f(x)
的调用帧,只保留g(3)
的调用帧。
这就叫做“尾调用优化”(Tail call optimization),即只保留内层函数的调用帧。如果所有函数都是尾调用,那么完全可以做到每次执行时,调用帧只有一帧,这将大大节省内存。这就是“尾调用优化”的意义。
注意,只有不再用到外层函数的内变量,内层函数的调用帧才会取代外层函数的调用帧,否则就无法进行“尾调用优化”。
3. 严格模式
ES6的尾递归优化只在严格模式下开启,正常模式下是无效的。
这是因为正常模式下,函数内部有两个变量,可以跟踪函数的调用栈。
func.arguments
:返回调用时函数的参数。func.caller
:返回调用当前函数的那个函数。
尾调用优化发生时,函数的调用栈会改写,因此上面两个变量就会失真。严格模式禁用这两个变量,所以尾调用模式仅在严格模式下生效。
1 | function restricted() { |
4. 尾递归优化的实现
尾递归优化只在严格模式下生效,那么正常模式下,或者那些不支持该功能的环境中,有没有办法也使用尾递归优化呢?回答是可以的,就是自己实现尾递归优化。
它的原理非常简单。尾递归之所以需要优化,原因是调用栈太多,造成溢出,那么只要减少调用栈,就不会溢出。怎么做可以减少调用栈呢?就是采用“循环”换掉“递归”。
下面是一个正常的递归函数。
1 | function sum(x, y) { |
上面代码中,sum
是一个递归函数,参数x
是需要累加的值,参数y
控制递归次数。一旦指定sum
递归100000次,就会报错,提示超出调用栈的最大次数。
蹦床函数(trampoline)可以将递归执行转换为循环执行。
1 | function trampoline(f) { |
上面就是蹦床函数的一个实现,它接受一个函数f
作为参数。只要f
执行后返回一个函数,就继续执行。注意,这里是返回一个函数,然后执行该函数,而不是函数里面调用函数,这样就避免了递归执行,从而就消除了调用栈过大的问题。
然后,要做的就是将原来的递归函数,改写为每一步返回另一个函数。
1 | function sum(x, y) { |
上面代码中,sum
函数的每次执行,都会返回自身的另一个版本。
现在,使用蹦床函数执行sum
,就不会发生调用栈溢出。
1 | trampoline(sum(1, 100000)); |
蹦床函数并不是真正的尾递归优化,下面的实现才是。
1 | function tco(f) { |
上面代码中,tco
函数是尾递归优化的实现,它的奥妙就在于状态变量active
。默认情况下,这个变量是不激活的。一旦进入尾递归优化的过程,这个变量就激活了。然后,每一轮递归sum
返回的都是undefined
,所以就避免了递归执行;而accumulated
数组存放每一轮sum
执行的参数,总是有值的,这就保证了accumulator
函数内部的while
循环总是会执行。这样就很巧妙地将“递归”改成了“循环”,而后一轮的参数会取代前一轮的参数,保证了调用栈只有一层。