忽然脑子有点混,想讨论下。
所以我考虑的方法是这样的:
一些代码就觉得自己数学底子差,不少公式查了都看不大懂。
有什么补数学基础的东西可以看嘛?
1
ryd994 2018-10-20 19:22:11 +08:00 via Android 2
恭喜重新发明了 normalization
https://en.wikipedia.org/wiki/Normalization_(statistics) |
2
Baymaxbowen 2018-10-20 19:27:33 +08:00 via Android
张宇的高等数学 36 讲
|
3
ytterbium 2018-10-20 19:36:23 +08:00 via Android
取绝对值是一阶范数。想做数据分析画箱线图是不是更好
|
4
kx5d62Jn1J9MjoXP 2018-10-20 20:00:31 +08:00
为什么是平方而不是绝对值, 为什么不用中值, 都是因为好算吧
|
5
byaiu 2018-10-20 20:03:08 +08:00 via Android
聚类可能比较方便
|
6
JCZ2MkKb5S8ZX9pq OP @ssynhtn 我后来想想,绝对值和平方值的区别。
其中一点是,平方值能 **放大远端的数据** 。 但伴随的问题是,碰到小于 1 的时候,效果就反了。 中值可能也是会影响结果。 比如咱们 10 个码农和 1 个马云,计算财富方差。 按中值的话就是 10 个码农的方差很小+1 个马云方差很大。 按平均值的话,就是 10 个码农方差很大+1 个马云方差很大。 在这个特例下,平均值求出来的,可能更接近期望结论。 |
7
yidinghe 2018-10-20 20:40:59 +08:00 via Android
简单的办法就是按照用户在房间内打赏的量倒排即可。
|
8
JCZ2MkKb5S8ZX9pq OP @ryd994 第一次听说这词,不过其中几个方法倒是经常用到。
|
9
alixali 2018-10-20 21:27:24 +08:00
在这里的付费都是正值,有中位数和平均值,根据两个的数比较,也是大致可以判断分布的是不是有偏的,和对应偏离程度啊。
|
10
JCZ2MkKb5S8ZX9pq OP @alixali 也是个思路 不过我也就是举例 主要问题还是怎么理解方差
|
11
alixali 2018-10-20 21:55:59 +08:00
我看统计上也只是说用来衡量分布的离散程度,或者是一个簇类的紧密程度吧,也不知道对不对。。
|
12
JCZ2MkKb5S8ZX9pq OP 而且如果是纯平方和,再开个根号,还能理解为多个维度中的距离。
比如 (x^2 + y^2)^0.5 = 二维平面原点到点的距离 (x^2 + y^2 + z^2)^0.5 = 三维空间原点到点的距离 这样可以扩展到 N。 但除以 N 或 N-1 放在这里又很难解释。 而且标准差直接开根号,等于对分母也开了根号,还是觉得有点别扭啊。 |
13
newton108 2018-10-21 03:09:18 +08:00 1
几何意义:demean 之后标准差是这个 r.v. 在希伯特空间中的 norm.
知道这个有啥用? |
14
mingl0280 2018-10-21 03:52:33 +08:00
你这不就是搞了个标准分数做统计么……
|
15
enenaaa 2018-10-21 12:26:46 +08:00
概率论和数理统计
|
16
JCZ2MkKb5S8ZX9pq OP @newton108 我有点晕 我查查哈
|
17
l00t 2018-10-22 09:21:00 +08:00
不理解,直接用。
从小学第一次接触到方差的概念开始就没理解过。我也觉得绝对值就足够了,方差不知道有啥意义。 |
18
alixali 2018-10-22 15:33:19 +08:00
@JCZ2MkKb5S8ZX9pq 正好今天看到一个有关无偏估计的解释,这里用到 n-1 也可能是为了得到无偏的数值。实际上上面那个公式的是 n/n-1。
|
19
JCZ2MkKb5S8ZX9pq OP @alixali 嗯 用 N-1 是爲了無偏 這點我理解
|