高性能WEB开发应用指南-.net-火龙果软件工程

分享到

三、高性能WEB开发进阶（下）

火龙果软件发布于 2014-04-24

五、高性能WEB开发之页面呈现、重绘、回流(1)

在讨论页面重绘、回流之前。需要对页面的呈现流程有些了解，页面是怎么把html结合css等显示到浏览器上的，下面的流程图显示了浏览器对页面的呈现的处理流程。可能不同的浏览器略微会有些不同。但基本上都是类似的。

1. 浏览器把获取到的html代码解析成1个Dom树，html中的每个tag都是Dom树中的1个节点，根节点就是我们常用的document对象( tag)。dom树就是我们用firebug或者IE Developer Toolbar等工具看到的html结构，里面包含了所有的html tag，包括display:none隐藏，还有用JS动态添加的元素等。

2. 浏览器把所有样式(主要包括css和浏览器的样式设置)解析成样式结构体，在解析的过程中会去掉浏览器不能识别的样式，比如IE会去掉-moz开头的样式，而firefox会去掉_开头的样式。

3、dom tree和样式结构体结合后构建呈现树(render tree),render tree有点类似于dom tree，但其实区别有很大，render tree能识别样式，render tree中每个node都有自己的style，而且render tree不包含隐藏的节点(比如display:none的节点，还有head节点)，因为这些节点不会用于呈现，而且不会影响呈现的，所以就不会包含到render tree中。注意 visibility:hidden隐藏的元素还是会包含到render tree中的，因为visibility:hidden 会影响布局(layout)，会占有空间。根据css2的标准，render tree中的每个节点都称为box(Box dimensions)，box所有属性：width,height,margin,padding,left,top,border等。

4. 一旦render tree构建完毕后，浏览器就可以根据render tree来绘制页面了。

回流与重绘

1. 当render tree中的一部分(或全部)因为元素的规模尺寸，布局，隐藏等改变而需要重新构建。这就称为回流(其实我觉得叫重新布局更简单明了些)。每个页面至少需要一次回流，就是在页面第一次加载的时候。

2. 当render tree中的一些元素需要更新属性，而这些属性只是影响元素的外观，风格，而不会影响布局的，比如background-color。则就叫称为重绘。

注：从上面可以看出，回流必将引起重绘，而重绘不一定会引起回流。

什么操作会引起重绘、回流

其实任何对render tree中元素的操作都会引起回流或者重绘，比如：

1. 添加、删除元素(回流+重绘)

2. 隐藏元素，display:none(回流+重绘)，visibility:hidden(只重绘，不回流)

3. 移动元素，比如改变top,left(jquery的animate方法就是,改变top,left不一定会影响回流)，或者移动元素到另外1个父元素中。(重绘+回流)

4. 对style的操作(对不同的属性操作，影响不一样)

5. 还有一种是用户的操作，比如改变浏览器大小，改变浏览器的字体大小等(回流+重绘)

让我们看看下面的代码是如何影响回流和重绘的:

var s = document.body.style;   
 
s.padding = "2px"; // 回流+重绘  
s.border = "1px solid red"; // 再一次 回流+重绘  
 
s.color = "blue"; // 再一次重绘  
s.backgroundColor = "#ccc"; // 再一次 重绘  
 
s.fontSize = "14px"; // 再一次 回流+重绘  
 
// 添加node，再一次 回流+重绘  
document.body.appendChild(document.createTextNode('abc!'));

请注意我上面用了多少个再一次。

说到这里大家都知道回流比重绘的代价要更高，回流的花销跟render tree有多少节点需要重新构建有关系，假设你直接操作body，比如在body最前面插入1个元素，会导致整个render tree回流，这样代价当然会比较高，但如果是指body后面插入1个元素，则不会影响前面元素的回流。

聪明的浏览器

从上个实例代码中可以看到几行简单的JS代码就引起了6次左右的回流、重绘。而且我们也知道回流的花销也不小，如果每句JS操作都去回流重绘的话，浏览器可能就会受不了。所以很多浏览器都会优化这些操作，浏览器会维护1个队列，把所有会引起回流、重绘的操作放入这个队列，等队列中的操作到了一定的数量或者到了一定的时间间隔，浏览器就会把flush队列，进行一个批处理。这样就会让多次的回流、重绘变成一次回流重绘。

虽然有了浏览器的优化，但有时候我们写的一些代码可能会强制浏览器提前flush队列，这样浏览器的优化可能就起不到作用了。当你请求向浏览器请求一些style信息的时候，就会让浏览器flush队列，比如：

1. offsetTop, offsetLeft, offsetWidth, offsetHeight

2. scrollTop/Left/Width/Height

3. clientTop/Left/Width/Height

4. width,height

5. 请求了getComputedStyle(), 或者 ie的 currentStyle

当你请求上面的一些属性的时候，浏览器为了给你最精确的值，需要flush队列，因为队列中可能会有影响到这些值的操作。

如何减少回流、重绘

减少回流、重绘其实就是需要减少对render tree的操作，并减少对一些style信息的请求，尽量利用好浏览器的优化策略。具体方法有：

1. 不要1个1个改变元素的样式属性，最好直接改变className，但className是预先定义好的样式，不是动态的，如果你要动态改变一些样式，则使用cssText来改变，见下面代码：

// 不好的写法  
var left = 1;  
var top = 1;  
el.style.left = left + "px";  
el.style.top  = top  + "px";  
 
// 比较好的写法   
el.className += " className1";  
 
// 比较好的写法   
el.style.cssText += "; left: " + left + "px; top: " + top + "px;";

2. 让要操作的元素进行"离线处理"，处理完后一起更新，这里所谓的"离线处理"即让元素不存在于render tree中，比如：

a) 使用documentFragment或div等元素进行缓存操作，这个主要用于添加元素的时候，大家应该都用过，就是先把所有要添加到元素添加到1个div(这个div也是新加的)，

最后才把这个div append到body中。

b) 先display:none 隐藏元素，然后对该元素进行所有的操作，最后再显示该元素。因对display:none的元素进行操作不会引起回流、重绘。所以只要操作只会有2次回流。

3 不要经常访问会引起浏览器flush队列的属性，如果你确实要访问，就先读取到变量中进行缓存，以后用的时候直接读取变量就可以了，见下面代码：

// 别这样写，大哥  
for(循环) {  
    elel.style.left = el.offsetLeft + 5 + "px";  
    elel.style.top  = el.offsetTop  + 5 + "px";  
}  
 
// 这样写好点  
var left = el.offsetLeft,top  = el.offsetTop,s = el.style;  
for(循环) {  
    left += 10;  
    top  += 10;  
    s.left = left + "px";  
    s.top  = top  + "px";  
}

4. 考虑你的操作会影响到render tree中的多少节点以及影响的方式，影响越多，花费肯定就越多。比如现在很多人使用jquery的animate方法移动元素来展示一些动画效果，想想下面2种移动的方法：

// block1是position:absolute 定位的元素，它移动会影响到它父元素下的所有子元素。  
// 因为在它移动过程中，所有子元素需要判断block1的z-index是否在自己的上面，  
// 如果是在自己的上面,则需要重绘,这里不会引起回流  
$("#block1").animate({left:50});  
// block2是相对定位的元素,这个影响的元素与block1一样，但是因为block2非绝对定位  
// 而且改变的是marginLeft属性，所以这里每次改变不但会影响重绘，  
// 还会引起父元素及其下元素的回流  
$("#block2").animate({marginLeft:50});

实例测试

最后用2个工具对上面的理论进行一些测试，这2个工具是在我 "web 性能测试工具推荐" 文章中推荐过的工具，分别是：dynaTrace(测试ie),Speed Tracer(测试Chrome)。

第一个测试代码不改变元素的规则，大小，位置。只改变颜色，所以不存在回流，仅测试重绘，代码如下：

<body> 
    <script type="text/javascript"> 
        var s = document.body.style;  
        var computed;  
        if (document.body.currentStyle) {  
          computed = document.body.currentStyle;  
        } else {  
          computed = document.defaultView.getComputedStyle(document.body, '');  
        }  
    function testOneByOne(){  
      s.color = 'red';;  
      tmp = computed.backgroundColor;  
      s.color = 'white';  
      tmp = computed.backgroundImage;  
      s.color = 'green';  
      tmp = computed.backgroundAttachment;  
    }  
      
    function testAll() {  
      s.color = 'yellow';  
      s.color = 'pink';  
      s.color = 'blue';  
        
      tmp = computed.backgroundColor;  
      tmp = computed.backgroundImage;  
      tmp = computed.backgroundAttachment;  
    }  
    </script>      
    color test <br /> 
    <button onclick="testOneByOne()">Test One by One</button> 
    <button onclick="testAll()">Test All</button> 
</body>

testOneByOne 函数改变3次color,其中每次改变后调用getComputedStyle,读取属性值(按我们上面的讨论，这里会引起队列的flush)，testAll同样是改变3次color，但是每次改变后并不马上调用getComputedStyle。

我们先点击Test One by One按钮，然后点击 Test All,用dynaTrace监控如下：

上图可以看到我们执行了2次button的click事件，每次click后都跟一次rendering(页面重绘)，2次click函数执行的时间都差不多,0.25ms,0.26ms，但其后的rendering时间就相差一倍多。(这里也可以看出，其实很多时候前端的性能瓶颈并不在于JS的执行，而是在于页面的呈现，这种情况在用JS做到富客户端中更为突出)。我们再看图的下面部分，这是第一次rendering的详细信息，可以看到里面有2行是 Scheduleing layout task，这个就是我们前面讨论过的浏览器优化过的队列，可以看出我们引发2次的flush。

再看第二次rendering的详细信息，可以看出并没有Scheduleing layout task,所以这次rendering的时间也比较短。

测试代码2：这个测试跟第一次测试的代码很类似，但加上了对layout的改变，为的是测试回流。

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
<head> 
</head> 
<body> 
    <script type="text/javascript"> 
        var s = document.body.style;  
        var computed;  
        if (document.body.currentStyle) {  
          computed = document.body.currentStyle;  
        } else {  
          computed = document.defaultView.getComputedStyle(document.body, '');  
        }  
    function testOneByOne(){  
      s.color = 'red';  
      s.padding = '1px';  
      tmp = computed.backgroundColor;  
      s.color = 'white';  
      s.padding = '2px';  
      tmp = computed.backgroundImage;  
      s.color = 'green';  
      s.padding = '3px';  
      tmp = computed.backgroundAttachment;  
    }  
      
    function testAll() {  
      s.color = 'yellow';  
      s.padding = '4px';  
      s.color = 'pink';  
      s.padding = '5px';  
      s.color = 'blue';  
      s.padding = '6px';  
        
      tmp = computed.backgroundColor;  
      tmp = computed.backgroundImage;  
      tmp = computed.backgroundAttachment;  
    }  
    </script>      
    color test <br /> 
    <button onclick="testOneByOne()">Test One by One</button> 
    <button onclick="testAll()">Test All</button> 
</body>

用dynaTrace监控如下：

相信这图不用多说大家都能看懂了吧，可以看出有了回流后，rendering的时间相比之前的只重绘，时间翻了3倍了，可见回流的高成本性啊。

大家看到时候注意明细处相比之前的多了个 Calcalating flow layout。

最后再使用Speed Tracer测试一下，其实结果是一样的，只是让大家了解下2个测试工具：

测试1：

图上第一次点击执行2ms(其中有50% 用于style Recalculation), 第二次1ms，而且第一次click后面也跟了2次style Recalculation,而第二次点击却没有style Recalculation。

但是这次测试发现paint重绘的时间竟然是一样的，都是3ms，这可能就是chrome比IE强的地方吧。

测试2：

从图中竟然发现第二次的测试结果在时间上跟第一次的完全一样，这可能是因为操作太少，而chrome又比较强大，所以没能测试明显结果出来，

但注意图中多了1个紫色部分，就是layout的部分。也就是我们说的回流。

六、该如何加载Google-Analytics(或其他第三方)的JS

很多网站为了获取用户访问网站的统计信息，使用了google-analytics或其他分析网站(下面的讨论中只提google-analytics,简称ga)。注册ga后，ga就会生成一段js脚本，很多人直接把这段js复制到的最后面就完事。可是ga自动生成的这段JS真的就是最合理的吗?

哪怎么样才算是合理，怎样才是不合理了?因ga只是1个分析工具，它的使用绝对不能影响到我们的程序，如果影响了，则是不合理的。不影响则是合理的。

目前ga的使用:

先看看ga自动生成的js脚本，如下：

<script type="text/javascript"> 
var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");  
document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' 
type='text/javascript'%3E%3C/script%3E"));  
</script> 
<script type="text/javascript"> 
try {  
var pageTracker = _gat._getTracker("UA-123456-1");  
pageTracker._trackPageview();  
} catch(err) {}</script>

看这段代码，使用document.write来加载JS，注意了，这样加载js是阻塞加载的，就是这个js没加载完，后面的所有资源和JS都不能下载和执行。可能你会觉的这段代码在body的最后面，后没已经没内容，没什么会阻塞的了。

还有一些你忽略了，相信很多人在写JS的时候需要在页面加载完毕后执行一些JS或AJAX，一般写在window.onload 事件，或者写入jquery的$(document).ready()方法中。这些JS就会被阻塞。如果我们的页面上很多数据在window.onload中使用AJAX加载，而偏偏这个时候ga因为某些原因(和谐和谐)不能访问，或者访问很慢的时候。问题就来，我们自己的JS一直在等待ga的JS加载完，只有等ga的js加载超时后才会执行我们的JS。

实例：

下面的代码使用jquery在document.ready发送1个ajax请求(请求126.com)。测试前修改host文件，让ga的js无法加载：

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">  
view sourceprint?  
<html xmlns="http://www.w3.org/1999/xhtml">  
<head>  
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />  
    <script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jquery/1.4/jquery.min.js"></script>  
    <script type="text/javascript">  
        $(document).ready(function(){  
            $.get("http://www.126.com/");  
        });  
  </script>    
</head>  
<body>  
    <script type="text/javascript">  
        var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");  
        document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' 
type='text/javascript'%3E%3C/script%3E"));  
        </script>  
        <script type="text/javascript">  
        try {  
        var pageTracker = _gat._getTracker("UA-123456-1");  
        pageTracker._trackPageview();  
        } catch(err) {}</script>  
</body>  
</html>

监控图：

上图可以看出ga加载不了，在20秒超时后，才执行我们的ajax请求，我们的ajax请求才花0.173s，但却等了20s。

合理使用ga:

要合理使用ga，需要解决2个问题：

1. 如何非加载ga的js，

2. 如何在ga的ja加载完毕后立刻执行 var pageTracker = _gat._getTracker("UA-123456-1");pageTracker._trackPageview(); 代码。

非阻塞加载js的方法，主要有2种：

1. 动态创建

2.使用new Image().src="", 这种方法只会下载JS，而不会解析JS。所以用这个加载js后，里面的函数也不能调用(这种方法一般用于预加载)。

完善后的代码：

<script type="text/javascript">   
    var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");  
    var head = document.getElementsByTagName("head")[0] || document.documentElement;  
    var script = document.createElement("script");  
    script.src = gaJsHost + "google-analytics.com/ga.js";  
 
    var done = false; // 防止onload，onreadystatechange同时执行  
    // 加载完毕后执行，适应所有浏览器  
    script.onload = script.onreadystatechange = function() {  
        if (!done && (!this.readyState || this.readyState === "loaded" || this.readyState === "complete")){  
            done = true;  
            try {  
                var pageTracker = _gat._getTracker("UA-123456-16");  
                pageTracker._trackPageview();  
            } catch(err) {}  
            script.onload = script.onreadystatechange = null;  
        }  
    };   
    head.insertBefore(script,head.firstChild);  
</script>

上面代码修改自jquery的ajax代码。上面代码很容易理解，动态创建script来加载js，通过onload,或 onreadystatechange 事件来加载完毕后执行代码。

代码修改完毕后再监控测试如下;

图中看出ga照样加载了20s，但我们的ajax请求并没有等20s后才执行，而是立刻执行了。

jquery 加载ga:

可能你觉的上面的代码写的比较多，比较繁琐，如果你用jquery的话，可以简化成下面这样：

 var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www.");  
$.getScript(gaJsHost + "google-analytics.com/ga.js",function(){  
try {  
var pageTracker = _gat._getTracker("UA-123456-16");  
pageTracker._trackPageview();  
} catch(err) {}  
});

七、高性能WEB开发之flush让页面分块逐步呈现

在处理比较耗时的请求的时候，我们总希望先让用户先看到部分内容，让用户知道系统正在进行处理，而不是无响应。一般大家在处理这种情况，都使用ajax，先把html输出到客户端，然后再用ajax取加载比较耗时的资源。用ajax麻烦的地方是增加了请求数，而且需要写额外的js代码、和js调用的请求接口。

正对这种情况，还有一种处理方法，就是让response分块编码进行传输。response分块编码，可以先传输一部分不需要处理的html代码到客户端，等其他耗时代码执行完毕后再传输另外的html代码。

分块编码(chunked encoding)

chunked encoding 是http1.1 才支持编码格式(当然目前没有哪个浏览器不支持1.1了)，chunked encoding 与一般的响应区别如下：

正常的响应：  
    HTTP/1.1 200 OK  
    Cache-Control: private, max-age=60 
    Content-Length: 75785  
    Content-Type: text/html; charset=utf-8  
    ..其他response headers  
          
   <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

chunked encoding 响应:  
   HTTP/1.1 200 OK  
   Cache-Control: private, max-age=60 
   Content-Length: 75785  
   Content-Type: text/html; charset=utf-8  
   Transfer-Encoding: chunked  
   ..其他response headers  
      
   chunk #1(这里通常是16进制的数字，标志这个块的大小)  
   <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"....  
    
   chunk #2  
   <div .....  
    
   chunk #3  
   ....</body></html>

实例(JSP)

一个简单的页面，分为头部(header)和内容(部分)，假设内容部分需要读取数据库，花费3秒时间,然后显示csdn的logo。header部分显示cnblogs的logo。代码如下：

<body> 
    <div id="head" style="border:1px solid #ccc;"> 
       cnblogs logo <img src="http://images.cnblogs.com/logo_small.gif" />     
    </div> 
    <br /> 
    <div id="content" style="border:1px solid blue;"> 
    <%  
        // 睡眠3秒  
        Thread.currentThread().sleep(3000);  
    %> 
        csdn logo<br /> 
        <img src="http://csdnimg.cn/www/images/csdnindex_piclogo.gif" />     
    </div> 
</body>

演示地址：http://213.186.44.204:8080/ChunkTest/nochunk.jsp (服务器比较差，请大家温柔点)

打开这个演示地址发现很正常的页面，在3秒后才开始下载显示2个logo，资源加载瀑布图如下：

现在把代码改成如下，加上flush，让response把之前的html分块输出：

<div id="head" style="border:1px solid #ccc;"> 
   cnblogs logo <img src="http://images.cnblogs.com/logo_small.gif" />     
</div> 
<%  
    out.flush(); // flush response，分块输出  
%> 
<br /> 
<div id="content" style="border:1px solid blue;"> 
    <%  
        // 睡眠3秒  
        Thread.currentThread().sleep(3000);  
    %> 
    csdn logo<br /> 
    <img src="http://csdnimg.cn/www/images/csdnindex_piclogo.gif" />     
</div>

演示地址：http://213.186.44.204:8080/ChunkTest/chunk.jsp

打开这个演示地址，是不是发现cnblogs logo先下载显示出来，3秒后csdn logo才显示，资源加载图如下：

从这个图发现，cnblogs的logo在jsp页面还没执行完就开始下载了，这就是分块输出的效果。

监控工具：

如何知道我们是否成功使用了chunk encoding了，只要用工具查看response header 中是否包含了Transfer-Encoding: chunked，如果包含了，则是分块了。但要想监控分块的详细信息，据我所知，目前只有httpwatch支持，可以查看我们到底分了多少块，但是数量好像都多显示了1个，如下图：