3.2 数据基础分析指标_电影产业数据挖掘-QQ阅读女生短篇网

上QQ阅读APP看书，第一时间看更新

3.2　数据基础分析指标

描述性指标分析主要是对电影产业数据进行基础性描述，主要用于描述变量的基本特征。通过对电影产业数据的基础性描述，可以对变量变化的综合特征进行全面的了解[1]。数据的基础性表示可以分为数据的集中趋势分析、离散程度分析及分布形态分析等，具体如图3.4所示。

图3.4　描述性统计指标

3.2.1　集中趋势指标

1．平均数

平均数[1]可以分为算术平均数、调和平均数和几何平均数3种。

1）算术平均数

算术平均数是最常用的数据集中趋势指标，表示数据集合的集中趋势。它是将总体标志总量除以总体单位总量而得到的均值。算术平均数的基本式是

算术平均数=总体标志总量／总体单位总量

算术平均数有简单算术平均数和加权算术平均数两种。

（1）简单算术平均数是将总体各单位每一个标志值加总得到的标志总量除以单位总量求出的平均指标。对于数据集合{X₁，X₂，…，X_n}，简单算术平均数计算方法为

（2）加权算术平均数首先用各组的标志值乘以相应的各组单位数求出各组标志总量，并加总求得总体标志总量，而后再将总体标志总量和总体单位总量对比。对于数据集合{X₁，X₂，…，X_n}，加权算术平均数计算方法为

其中f表示各组的权数。

2）调和平均数

调和平均数又称倒数平均数，是总体各统计变量倒数的算术平均数的倒数。调和平均数是平均数的一种。但统计调和平均数，与数学调和平均数不同，它是变量倒数的算术平均数的倒数。由于它是根据变量的倒数计算的，所以又称倒数平均数。调和平均数也有简单调和平均数和加权调和平均数两种。

（1）简单调和平均数是算术平均数的变形。对于数据集合{X₁，X₂，…，X_n}，简单调和平均数计算方法为

（2）加权调和平均数是加权算术平均数的变形。它与加权算术平均数在实质上是相同的，仅有形式上的区别，即表现为变量对称的区别、权数对称的区别和计算位置对称的区别。对于数据集合{X₁，X₂，…，X_n}，加权调和平均数计算方法为

其中f表示各组的权数。

3）几何平均数

几何平均数是对各变量值的连乘积项开数次方。求几何平均数的方法叫做几何平均法。如果总水平、总成果等于所有阶段、所有环节水平、成果的连乘积总和时，求各阶段、各环节的一般水平、一般成果，要使用几何平均法计算几何平均数，而不能使用算术平均法计算算术平均数。几何平均数也分为简单几何平均数和加权几何平均数两种形式。

（1）对于数据集合{X₁，X₂，…，X_n}，简单几何平均数计算方法为