关于Normalization的方法以及实现

在处理数据的时候,因为数据的大小差别会比较大,为了避免数据的特征被其他特征吃掉,需要对数据进行normalization的处理

(0,1) 标准化

找到最大值和最小值,以最大值为1,最小值为0,计算其他数据在0到1之间的分布。

1
2
def normal0_1(x,Max,Min):
return (x-Min)/(Max-Min)

使用np.max(),np.min来找最大值和最小值

正态分布

输入原始数据的均值和标准差,对数据处理,处理之后的数据是标准正态分布(均值是0,标准差是1)

1
2
def Normalization(x, mu, sigma):
return (x-mu) / sigma

使用np.average()和np.std()找到均值和标准差

Sigmoid函数

sigmoid函数关于(0, 0.5)中心对称,在中心附近斜率较大,在负无穷接近0,正无穷接近1
sigmoid

1
2
def sigmood(x):
return 1.0/(1+np.exp(-float(x)))