工作中很多人提问:置信度和置信区间是什么意思,能通俗易懂的讲一下吗?
置信度:以测量值为中心,在一定范围内,真值出现在该范围内的几率。一般设定在2σ,也就是95%,95%是通常情况下置信度(置信水平)的设定值。
置信区间:在某一置信度下,以测量值为中心,真值出现的范围。 我们在论文里经常看到CI,CI是置信区间,一定概率下真值得取值范围(可靠范围)称为置信区间。其概率称为置信概率或置信度(置信水平)。
真实数据往往是实际上不能获知的,我们只能进行估计,估计的结果是给出一对数据,比如从1到1.5,真实的值落在1到1.5之间的可能性是95%(也有5%的可能性在这区间之外的)。区间是由抽样的数据根据大样定律结合查表得来的。区间越小精度越高,区间越大置信度越高。
打个比方,我们猜小妮子的年龄,你给出区间是25-35,这个区间很小置信度很低但精度就很高,你说在8岁到80岁之间,那是百分百的置信度了,不过精度太低毫无意义。的确99%准确度高于95%,但是它的精度(精密度)就低于95%。95%的置信度是一般通用的。
更专业的解释:
置信区间的定义
首先我们先定义一些区间估计的概念。
θ:待估计的总体参数
θL:由样本确定的置信下限
θU:由样本确定的置信上限
α:大于0,小于1的数值
1-α:置信度
如果由样本确定的两个统计量θL 和θU 满足P (θL<θ<θU)=1-α, 就称随机区间(θL,θU) 是θ 的置信度为1-α 的置信区间。θL 和θU 分别称为置信度为1-α 的置信下限和置信上限,1-α 称为置信度。我们估计小学生的平均身高是在1.40m和1.50m之间,可靠程度为95%。现在可以用公式将以上的叙述表达出来,即
P(1.40<? <1.50)=95%
式中的?表示小学生的平均身高。(1.40<? <1.50)是置信区间;95%是置信度,1.40m和1.50m分别是置信下限和置信上限。
置信区间的分类
双侧置信区间:上例中的(1.40<? <1.50)属于双侧置信区间。
单侧置信区间:在有些场合下,我们只关心总体参数的某一侧界限。例如,对于产品的寿命来说,消费者只关心其寿命的下限,对其上限则希望越长越好;而对于许多成本,则正好相反。
区间估计的原理
下面我们以估计总体参数为例,说明区间估计的原理。设有总体X~N(?,σ2),σ2已知,估计?的置信度为1-α的双侧置信区间。从总体中随机抽取样本容量为n的样本,样本均值为`X。所以样本随机变量可以表示为`X~N(?,σ2/n)。(由总体随机变量X~N(?,σ2),样本容量为n,样本均值为`X,得到样本随机变量为`X~N(?,σ2/n)的具体推理过程,请见连续型随机变量——抽样分布)
根据样本随机变量`X~N(?,σ2/n),经过变换可得随机变量(`X-?)/σ/?n~N(0,1)。(由正态分布`X~N(?,σ2/n),转换成标准正态分布(`X-?)/σ/?n~N(0,1)的具体推理过程,请见连续型随机变量——正态分布)已知给定置信度为1-α,则随机变量落在(-Zα/2,Zα/2)区间的概率为P(-Zα/2<(`X-?)/σ/?n
经变换可得P(`X-Zα/2*σ/?n<?<`X+Zα/2*σ/?n) =1-α
即为? 的置信度1-α 为的双侧置信区间。以上即为由样本参数推断总体置信区间的过程。
置信度与置信区间的关系
在估计总体参数时,一般都会给出一个较高的置信度,如95%或99%等。但是,当样本容量n为一定时,置信度越高,置信区间就越大,也即估计的参数的相对精度就会越低。反之,置信度越低,则精度相对就会越高。解决这一矛盾的方法就是增加样本容量n。