Calc 中的数据统计
使用 Calc 中的数据统计功能执行复杂的数据分析
要进行复杂的统计或工程分析, 可以使用「Calc 数据统计」节省步骤和时间。您可以为每次分析提供数据和参数, 这组工具可使用适当的统计或工程函数来计算和并在输出表格中显示结果。
采样
使用从另一个表格中采样的数据创建一个表格。
通过采样, 您可以从「源」表格中选取数据以填充目标表格。采样可以是随机的, 也可以是周期性的。

采样按行进行。这意味着, 采样的数据将选取源表格的整行,并复制到目标表格的一整行中。
采样方法
「随机」: 以随机方式选取源表格中恰好样本大小行。
「样本大小」: 从源表格中采样的行数。
「周期性」: 按「周期」定义的步伐选取行。
「周期」: 采样时周期性跳过的行数。
示例
以下数据将用作采样的源数据表示例:
A |
B |
C |
|
1 |
11 |
21 |
31 |
2 |
12 |
22 |
32 |
3 |
13 |
23 |
33 |
4 |
14 |
24 |
34 |
5 |
15 |
25 |
35 |
6 |
16 |
26 |
36 |
7 |
17 |
27 |
37 |
8 |
18 |
28 |
38 |
9 |
19 |
29 |
39 |
周期为 2 的采样将产生下表:
12 |
22 |
32 |
14 |
24 |
34 |
16 |
26 |
36 |
18 |
28 |
38 |
描述性统计
用数据集的主要统计属性填充电子表格中的表格。
「描述性统计」分析工具为输入范围内的数据生成单变量统计报告, 提供有关数据的中心趋势和可变性的信息。

关于「描述性统计」的更多信息,请参考阅读相应的维基百科文章。
下表显示了上述示例数据的描述性统计结果。
第 1 列 |
第 2 列 |
第 3 列 |
|
平均值 |
41.9090909091 |
59.7 |
44.7 |
标准误差 |
3.5610380138 |
5.3583786934 |
4.7680650629 |
模式 |
47 |
49 |
60 |
中位数 |
40 |
64.5 |
43.5 |
方差 |
139.4909090909 |
287.1222222222 |
227.3444444444 |
标准偏差 |
11.8106269559 |
16.944681237 |
15.0779456308 |
峰度 |
-1.4621677981 |
-0.9415988746 |
1.418052719 |
偏度 |
0.0152409533 |
-0.2226426904 |
-0.9766803373 |
区域 |
31 |
51 |
50 |
最小 |
26 |
33 |
12 |
最大 |
57 |
84 |
62 |
总和 |
461 |
597 |
447 |
计数 |
11 |
10 |
10 |
方差分析 (ANOVA)
生成给定数据集的方差分析 (ANOVA)
ANOVA 是「方差分析」 (ANalysis Of VAriance) 的缩写。该工具可对指定数据集进行方差分析

关于「方差分析」的更多信息,请参考阅读相应的维基百科文章。
类型
选择分析是针对「单因素」还是「双因素」方差分析。
参数
「α」: 检测的重要性级别。
「每个采样的行数」: 定义每个采样的行数。
下表显示了上述示例数据的「方差分析 (ANOVA)」结果。
方差分析 - 单因素 |
|||||
α |
0.05 |
||||
分组 |
计数 |
求和 |
均值 |
方差 |
|
第 1 列 |
11 |
461 |
41.9090909091 |
139.4909090909 |
|
第 2 列 |
10 |
597 |
59.7 |
287.1222222222 |
|
第 3 列 |
10 |
447 |
44.7 |
227.3444444444 |
|
差异来源 |
SS |
df |
MS |
F |
P 值 |
组间 |
1876.5683284457 |
2 |
938.2841642229 |
4.3604117704 |
0.0224614952 |
组内 |
6025.1090909091 |
28 |
215.1824675325 |
||
总计 |
7901.6774193548 |
30 |
相关性
计算两组数字数据的相关性。
相关系数 (介于 -1 和 + 1 之间的值) 表示两个变量之间的相关性有多大。您可以使用 CORREL 函数或「数据统计」来求两个变量之间的相关系数。
相关系数 +1 表示完全正相关。
相关系数 -1 表示完全负相关

关于「统计相关」的更多信息,请参考阅读相应的维基百科文章。
下表显示了上述示例数据的相关性结果。
相关性 |
第 1 列 |
第 2 列 |
第 3 列 |
第 1 列 |
1 |
||
第 2 列 |
-0.4029254917 |
1 |
|
第 3 列 |
-0.2107642836 |
0.2309714048 |
1 |
协方差
计算两组数字数据的协方差。
协方差是衡量两个随机变量一同变化的程度的指标。

关于「统计协方差」的更多信息,请参考阅读相应的维基百科文章。
下表显示了上述示例数据的协方差结果。
协方差 |
第 1 列 |
第 2 列 |
第 3 列 |
第 1 列 |
126.8099173554 |
||
第 2 列 |
-61.4444444444 |
258.41 |
|
第 3 列 |
-32 |
53.11 |
204.61 |
指数平滑
生成平滑后的数据序列
指数平滑是一种筛选技术, 当应用于数据集时, 会产生平滑化的结果。它被应用于许多领域, 如股票市场、经济学以及抽样测量。

关于「指数平滑」的更多信息,请参考阅读相应的维基百科文章。
参数
「平滑系数」: 介于 0 和 1 之间的参数, 表示平滑方程中的阻尼因子 α。
平滑系数为 0.5 时,产生的平滑结果如下:
α |
|
0.5 |
|
第 1 列 |
第 2 列 |
1 |
0 |
1 |
0 |
0.5 |
0 |
0.25 |
0.5 |
0.125 |
0.25 |
0.0625 |
0.125 |
0.03125 |
0.0625 |
0.015625 |
0.03125 |
0.0078125 |
0.015625 |
0.00390625 |
0.0078125 |
0.001953125 |
0.00390625 |
0.0009765625 |
0.001953125 |
0.0004882813 |
0.0009765625 |
0.0002441406 |
0.0004882813 |
移动平均
计算时间序列的移动平均

关于「移动平均」的更多信息,请参考阅读相应的维基百科文章。
参数
「间隔」: 移动平均计算中使用的样本数。
加权平均的结果:
第 1 列 |
第 2 列 |
#N/A |
#N/A |
0.3333333333 |
0.3333333333 |
0 |
0.3333333333 |
0 |
0.3333333333 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
#N/A |
#N/A |
配对 t 检验
计算两个数据样本的配对 t 检验。
「配对 t 检验」是遵循学生 t 分布的任何统计假设检验。

关于「配对 t 检验」的更多信息,请参考阅读相应的维基百科文章。
数据
「变量 1 范围」: 要分析的第一个数据序列的范围的引用。
「变量 2 范围」: 要分析的第二个数据序列的范围的引用。
「结果输出到」: 显示检验的区域左上角的单元格的引用。
配对 t 检验的结果:
下表显示了上述数据序列的「配对 t 检验」:
配对 t 检验 |
||
α |
0.05 |
|
假设的均差 |
0 |
|
变量 1 |
变量 2 |
|
平均值 |
16.9230769231 |
20.4615384615 |
方差 |
125.0769230769 |
94.4358974359 |
观测值 |
13 |
13 |
皮尔逊相关系数 |
-0.0617539772 |
|
观测的均差 |
-3.5384615385 |
|
差异的方差 |
232.9358974359 |
|
df |
12 |
|
t 统计 |
-0.8359262137 |
|
P (T<=t) 单尾 |
0.2097651442 |
|
t 临界单尾 |
1.7822875556 |
|
P (T<=t) 双尾 |
0.4195302884 |
|
t 临界双尾 |
2.1788128297 |
F-检验
计算两个数据样本的 F 检验。
「F 检验」是基于零假设下 F 分布的任何统计检验。

关于「F 检验」的更多信息,请参考阅读相应的维基百科文章。
数据
「变量 1 范围」: 要分析的第一个数据序列的范围的引用。
「变量 2 范围」: 要分析的第二个数据序列的范围的引用。
「结果输出到」: 显示检验的区域左上角的单元格的引用。
F 检验的结果:
下表显示了上述数据序列的「F 检验」:
F 检验 |
||
α |
0.05 |
|
变量 1 |
变量 2 |
|
平均值 |
16.9230769231 |
20.4615384615 |
方差 |
125.0769230769 |
94.4358974359 |
观测值 |
13 |
13 |
df |
12 |
12 |
F |
1.3244637524 |
|
P (F<=f) 右尾 |
0.3170614146 |
|
F 临界右尾 |
2.6866371125 |
|
P (F<=f) 左尾 |
0.6829385854 |
|
F 临界左尾 |
0.3722125312 |
|
P 双尾 |
0.6341228293 |
|
F 临界双尾 |
0.3051313549 |
3.277277094 |
Z 测试
计算两个数据样本的 z 检验。

关于「Z 检验」的更多信息,请参考阅读相应的维基百科文章。
数据
「变量 1 范围」: 要分析的第一个数据序列的范围的引用。
「变量 2 范围」: 要分析的第二个数据序列的范围的引用。
「结果输出到」: 显示检验的区域左上角的单元格的引用。
Z 测试的结果:
下表显示了上述数据序列的「z 检验」:
z 检验 |
||
α |
0.05 |
|
假设的均差 |
0 |
|
变量 1 |
变量 2 |
|
已知方差 |
0 |
0 |
平均值 |
16.9230769231 |
20.4615384615 |
观测值 |
13 |
13 |
观测的均差 |
-3.5384615385 |
|
z |
#DIV/0! |
|
P (Z<=z) 单尾 |
#DIV/0! |
|
z 临界单尾 |
1.644853627 |
|
P (Z<=z) 双尾 |
#DIV/0! |
|
z 临界双尾 |
1.9599639845 |
卡方检验
计算数据样本的卡方测试。

关于「卡方检验」的更多信息,请参考阅读相应的维基百科文章。
数据
「输入范围」: 要分析的数据序列范围的引用。
「结果输出到」: 显示检验的区域左上角的单元格的引用。
卡方检验结果:
独立性检验 (卡方检验) |
|
α |
0.05 |
df |
12 |
P 值 |
2.32567054678584E-014 |
检验统计 |
91.6870055842 |
临界值 |
21.0260698175 |