statistical_data_type统计数据类型
The following table classifies the various simple data types, associated distributions, permissible operations, etc. Regardless of the logical possible values, all of these data types are generally coded using real numbers, because the theory of random variables often explicitly assumes that they hold real numbers. 下表对各种简单的数据类型、相关的分布、允许的操作等进行了分类。不管逻辑上的可能值是多少,所有这些数据类型通常都是用实数编码的,因为随机变量理论通常明确假设它们都是实数。
Data Type 数据类型 |
Possible values 可能值 |
Example usage 应用示例 |
Level of measurement 测量层次 |
Distribution 分布 |
Scale of relative differences 尺度相对差异 |
Permissible statistics 允许的统计数据 |
Regression analysis 回归分析 |
---|---|---|---|---|---|---|---|
binary 二分类数据 |
0, 1 (arbitrary labels) 0, 1(任意标签) |
binary outcome ("yes/no", "true/false", "success/failure", etc.) 二分结果(是/否、真/假、成功/失败等) |
nominal scale 定类尺度 |
Bernoulli 伯努利分布 |
incomparable 不可比较 |
mode, Chi-squared 众值、卡方值 |
logistic, probit 逻辑回归、概率 |
categorical 多分类数据 |
1, 2, ..., K (arbitrary labels) 1, 2, ..., K(任意标签) |
categorical outcome (specific blood type, political party, word, etc.) 多分类结果(特定血型、党派、词等) |
nominal scale 定类尺度 |
categorical 多分类分布 |
incomparable 不可比较 |
mode, Chi-squared 众值、卡方值 |
multinomial logit, multinomial probit 多项式逻辑回归、多项式概率 |
ordinal 定序数据 |
integer or real number (arbitrary scale) 整数或实数(任意比例) |
relative score, significant only for creating a ranking 相对分数,只对排名有意义 |
ordinal scale 定序尺度 |
categorical?? 分类分布?? |
relative comparison 相对比较 |
ordinal regression (ordered logit, ordered probit) 有序回归(有序逻辑回归,有序概率) |
|
binomial 二项式数据 |
0, 1, ..., N |
number of successes (e.g. yes votes) out of N possible N个可能中的成功数(如赞成票) |
interval scale?? 定距尺度 |
binomial, beta-binomial, etc. 二项式分布、贝塔二项式分布 |
additive?? 可加减 |
mean, median, mode, standard deviation, correlation 均值、中值、众值、标准差、相关系数 |
binomial regression (logistic, probit) 二项式回归(逻辑回归、概率) |
count 计数 |
nonnegative integers (0, 1, ...) 非负整数(0, 1, ...) |
number of items (telephone calls, people, molecules, births, deaths, etc.) in given interval/area/volume 给定区间/面积/容量的事项(电话呼叫、人员、分子、出生、死亡等)的计数 |
ratio scale 定比尺度 |
Poisson, negative binomial, etc. 泊松分布、负二项式等 |
multiplicative 可乘除 |
All statistics permitted for interval scales plus the following: geometric mean, harmonic mean, coefficient of variation 定距尺度允许的所有统计加上:几何平均值,调和平均值,变异系数 |
Poisson, negative binomial regression 泊松回归、负二项式回归 |
real-valued additive 可加减的实值数据 |
real number 实数 |
temperature, relative distance, location parameter, etc. (or approximately, anything not varying over a large scale) 温度、相对距离、位置参数等(或者近似地说,任何在大范围内没有变化的东西)。 |
interval scale 定比尺度 |
normal, etc. (usually symmetric about the mean) 正态分布等(通常关于均值对称)。 |
additive 可加减的 |
mean, median, mode, standard deviation, correlation 均值、中值、众值、标准差、相关系数 |
standard linear regression 标准线性回归 |
real-valued multiplicative 可乘除的实值数据 |
positive real number 正实数 |
price, income, size, scale parameter, etc. (especially when varying over a large scale) 价格、收益、规模、规模参数等(特别是在大范围变化时) |
ratio scale 定比尺度 |
log-normal, gamma, exponential, etc. (usually a skewed distribution)对数正态分布、伽马分布、指数分布等(通常是偏态分布)。 | multiplicative 可乘除的 |
All statistics permitted for interval scales plus the following: geometric mean, harmonic mean, coefficient of variation 定距尺度允许的所有统计加上:几何平均值,调和平均值,变异系数 |
generalized linear model with logarithmic link 具有对数环节的广义线性模型 |
只有最后2种可以是连续变量,前面5种一定是离散变量。