样本数据足够多时为了剔除一些极端值对研究的影响,一般会对连续变量进行缩尾处理(Winsorize)。 通常在1%和99%分位做极端值处理,对于小于1%的数用1%的值赋值,对于大于99%的数用99%的值赋值。