博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据预处理--标准化/归一化
阅读量:6818 次
发布时间:2019-06-26

本文共 1198 字,大约阅读时间需要 3 分钟。

1. fit--transform--fit_transform区别

  • fit原义指的是使适合的意思,其实有点train的含义但是和train不同的是,它并不是一个训练的过程,而是一个适配的过程,过程都是定死的,最后只是得到了一个统一的转换的规则模型
  • transform:是将数据进行转换,比如数据的归一化和标准化,将测试数据按照训练数据同样的模型进行转换,得到特征向量。
  • fit_transform:可以看做是fit和transform的结合,如果训练阶段使用fit_transform,则在测试阶段只需要对测试样本进行transform就行了。

2. 标准化归一化

from sklearn import preprocessing#标准化std_scale = preprocessing.StandardScaler().fit(df[['Alcohol', 'Malic acid']])df_std = std_scale.transform(df[['Alcohol', 'Malic acid']])#归一化minmax_scale = preprocessing.MinMaxScaler().fit(df[['Alcohol', 'Malic acid']])df_minmax = minmax_scale.transform(df[['Alcohol', 'Malic acid']])#结果输出print('Mean after standardization:\nAlcohol={:.2f}, Malic acid={:.2f}'      .format(df_std[:,0].mean(), df_std[:,1].mean()))print('\nStandard deviation after standardization:\nAlcohol={:.2f}, Malic acid={:.2f}'      .format(df_std[:,0].std(), df_std[:,1].std()))print('Min-value after min-max scaling:\nAlcohol={:.2f}, Malic acid={:.2f}'      .format(df_minmax[:,0].min(), df_minmax[:,1].min()))print('\nMax-value after min-max scaling:\nAlcohol={:.2f}, Malic acid={:.2f}'      .format(df_minmax[:,0].max(), df_minmax[:,1].max()))

 

转载于:https://www.cnblogs.com/itbuyixiaogong/p/9848435.html

你可能感兴趣的文章
2018电影票房分析-谁才是票房之王
查看>>
程序员可以干到多少岁?
查看>>
Storm系列(六)storm和kafka集成
查看>>
东南亚的招聘骗局,程序员请注意!
查看>>
Android 获得View宽高的几种方式
查看>>
iOS正则表达式
查看>>
关于javascript的this指向问题
查看>>
Promise的理解和用法
查看>>
java B2B2C Springboot电子商城系统-高可用的服务注册中心
查看>>
Dubbo的总体架构
查看>>
Spring Cloud微服务架构代码结构详细讲解
查看>>
以太经典硬分叉:矿工欢喜、投资者欢庆、社区高兴的“三赢”之举
查看>>
我的友情链接
查看>>
LVS启(禁)用成员
查看>>
innobackupex 备份报错
查看>>
2016 IT 运维工作计划及学习
查看>>
将一个数的二进制位模式从左到右翻转并输出
查看>>
jQuery学习之jQuery Ajax用法详解
查看>>
关于JEPLUS软件介绍——JEPLUS软件快速开发平台
查看>>
动态增加UIView到当前视图中
查看>>