statistical_data_type统计数据类型

The following table classifies the various simple data types, associated distributions, permissible operations, etc. Regardless of the logical possible values, all of these data types are generally coded using real numbers, because the theory of random variables often explicitly assumes that they hold real numbers. 下表对各种简单的数据类型、相关的分布、允许的操作等进行了分类。不管逻辑上的可能值是多少,所有这些数据类型通常都是用实数编码的,因为随机变量理论通常明确假设它们都是实数。

Data Type
数据类型
Possible values
可能值
Example usage
应用示例
Level of measurement
测量层次
Distribution
分布
Scale of relative differences
尺度相对差异
Permissible statistics
允许的统计数据
Regression analysis
回归分析
binary
二分类数据
0, 1 (arbitrary labels)
0, 1(任意标签)
binary outcome ("yes/no", "true/false", "success/failure", etc.)
二分结果(是/否、真/假、成功/失败等)
nominal scale
定类尺度
Bernoulli
伯努利分布
incomparable
不可比较
mode, Chi-squared
众值、卡方值
logistic, probit
逻辑回归、概率
categorical
多分类数据
1, 2, ..., K (arbitrary labels)
1, 2, ..., K(任意标签)
categorical outcome (specific blood type, political party, word, etc.)
多分类结果(特定血型、党派、词等)
nominal scale
定类尺度
categorical
多分类分布
incomparable
不可比较
mode, Chi-squared
众值、卡方值
multinomial logit, multinomial probit
多项式逻辑回归、多项式概率
ordinal
定序数据
integer or real number (arbitrary scale)
整数或实数(任意比例)
relative score, significant only for creating a ranking
相对分数,只对排名有意义
ordinal scale
定序尺度
categorical??
分类分布??
relative comparison
相对比较
ordinal regression (ordered logit, ordered probit)
有序回归(有序逻辑回归,有序概率)
binomial
二项式数据
0, 1, ..., N
number of successes (e.g. yes votes) out of N possible
N个可能中的成功数(如赞成票)
interval scale??
定距尺度
binomial, beta-binomial, etc.
二项式分布、贝塔二项式分布
additive??
可加减
mean, median, mode, standard deviation, correlation
均值、中值、众值、标准差、相关系数
binomial regression (logistic, probit)
二项式回归(逻辑回归、概率)
count
计数
nonnegative integers (0, 1, ...)
非负整数(0, 1, ...)
number of items (telephone calls, people, molecules, births, deaths, etc.) in given interval/area/volume
给定区间/面积/容量的事项(电话呼叫、人员、分子、出生、死亡等)的计数
ratio scale
定比尺度
Poisson, negative binomial, etc.
泊松分布、负二项式等
multiplicative
可乘除
All statistics permitted for interval scales plus the following: geometric mean, harmonic mean, coefficient of variation
定距尺度允许的所有统计加上:几何平均值,调和平均值,变异系数
Poisson, negative binomial regression
泊松回归、负二项式回归
real-valued additive
可加减的实值数据
real number
实数
temperature, relative distance, location parameter, etc. (or approximately, anything not varying over a large scale)
温度、相对距离、位置参数等(或者近似地说,任何在大范围内没有变化的东西)。
interval scale
定比尺度
normal, etc. (usually symmetric about the mean)
正态分布等(通常关于均值对称)。
additive
可加减的
mean, median, mode, standard deviation, correlation
均值、中值、众值、标准差、相关系数
standard linear regression
标准线性回归
real-valued multiplicative
可乘除的实值数据
positive real number
正实数
price, income, size, scale parameter, etc. (especially when varying over a large scale)
价格、收益、规模、规模参数等(特别是在大范围变化时)
ratio scale
定比尺度
log-normal, gamma, exponential, etc. (usually a skewed distribution)对数正态分布、伽马分布、指数分布等(通常是偏态分布)。 multiplicative
可乘除的
All statistics permitted for interval scales plus the following: geometric mean, harmonic mean, coefficient of variation
定距尺度允许的所有统计加上:几何平均值,调和平均值,变异系数
generalized linear model with logarithmic link
具有对数环节的广义线性模型

只有最后2种可以是连续变量,前面5种一定是离散变量。