• 热门专题

你还在为如何对DataFrame空值处理头疼吗

作者:whl  发布日期:2018-11-12 08:33:00
Tag标签:DataFrame,空值处理  
  •   大家从数据清洗这几个字字面上就可以理解为是把数据给清洗干净的意思,具体就是指我们在识别错误数据的最后一个步骤里可以使用它来进行纠错和识别,其中也需要对数据的一致性进行检查,把那些没有意义的数值和有所缺失的值处理掉。下面将给大家介绍一下数据清洗的一个小内容,就是DataFrame中的空值处理方法,这个方法现在使用的人挺多的,也比较具有价值,大家可以参考下。

      数据清洗是一项复杂且繁琐的工作,同时也是整个数据分析过程中最为重要的环节。

      在python中空值被显示为NaN。首先,我们要构造一个包含NaN的DataFrame对象。

    DataFrame对象

      删除NaN

      删除NaN所在的行

      删除表中全部为NaN的行

    删除表中全部为NaN的行

      删除表中任何含有NaN的行

    删除表中任何含有NaN的行

      删除NaN所在的列

      删除表中全部为NaN的列

    删除表中全部为NaN的列

      删除表中任何含有NaN的列

    删除表中任何含有NaN的列

      注意:axis 就是”轴,数轴“的意思,对应多维数组里的”维“。此处作者的例子是二维数组,所以,axis的值对应表示:0轴(行),1轴(列)。

      填充NaN

      如果不想过滤(去除)数据,我们可以选择使用fillna()方法填充NaN,这里,作者使用数值'0'替代NaN,来填充DataFrame。

    填充DataFrame

      我们还可以通过字典来填充,以实现对不同的列填充不同的值。

    填充不同的值

      好了,今天给大家介绍的DataFrame中的空值处理方法是属于数据清洗中的一种,大家如果觉得这个方法可用的话也可以尝试下操作,当然如果你觉得你自己的方法更加容易也没关系,可以继续使用。

延伸阅读:

About IT165 - 广告服务 - 隐私声明 - 版权申明 - 免责条款 - 网站地图 - 网友投稿 - 联系方式
本站内容来自于互联网,仅供用于网络技术学习,学习中请遵循相关法律法规