一个每天1000万PV的网站需要什么样的性能去支撑呢?

继续上一篇,下面我们就来计算一下,前面我们已经搞到了一票数据,但是这些数据的意义还没有说。技术是为业务服务的,下面就来说说怎么让些数据变得有意义。

一、聚合报告

初识聚合报告是不是有些眼熟,是的你没看错,他跟Apache AB的结果是类似的,事实上LoadRunner也会有一票这样类似的数据。

下面分别说下各个数据的意义,其中标成红色的是需要特别关注的。

1. #Samples:样本数,如果你看过上一篇,这个就是前面我们那个公式算出来的结果

(Loop Count(Loop Controler)*Number of Threads*Loop Count(group))

2. Average:平均响应时间。

3. Median:中位数,50%用户响应时间。

4. %90 Line:90%用户响应时间。

5. Min:最小响应时间。

6. Max:最大响应时间。

7. Error%:本次测试中出现错误的请求的数量/请求的总数

8. Throughput:吞吐量,表示每秒完成的请求数。

9. KB/Sec:每秒从服务器端接收到的数据量(只是接收)。

下面说说几个重点参数:

1.为什么说%90 Line重要呢?

举个栗子:姚明与郭敬明平均身高约1.84米能说明什么?如果这个例子不够形象再想想我大天朝的平均工资。所以平均不代表公平,因为总有那么一小撮人会极大的影响平均值,而大多数人是被平均的。

90% Line (90 th Percentile) is the value below which 90% of the samples fall. The remaining samples too at least as long as the value. This is a standard statistical measure. See, for example: Percentile entry at Wikipedia.

貌似这段话说的不明不白,但他给我提示了一个重要的词Percentile,于是我们继续跟进,原来这是一个统计术语。维基上有详细说明,并有公式:n=(100/P)*N+1/2

其中n=排序位;P=待排序值;N=总的排序值数量

说白了就是将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。

2.Error%

这个不说了,大家都懂。

3.Throughput

这又是个很重要的参数了,开头提到的PV计算就跟这个数有关了。

计算公式见下图,通过Throughput可以换算出PV,当然为了应付突发状况还要留出一定的Buffer。

所以现在回到开头的那个问题,理论上每秒231的事务数就可以(10000000*0.8)/(24*60*60*0.4),当然这只是理论上;-)


4.KB/Sec

这个不细说了,跟计算你的机房带宽有关的。

二、图形结果

这里比较重要的参数是偏离量。

偏离量,理论上是越小系统稳定的。但多少是小呢?所以这种说法是不准确的,“朝菌不知晦朔,蟪蛄不知春秋”,在不同的场景下对标准的定义也是不同的。

因为对正态分布和置信区间这块我也不太懂,这里就不敢瞎说了。

三、结果树

请求的执行状态,这里略。