王彦平(蓝鲸)/著
王彦平(蓝鲸)/著

《从Excel到Python——数据分析进阶指南》是一本比较适合小白阅读的数据分析书籍,该书的每一章知识点都是从excel慢慢过度到python,所以理解起来会比较轻松。

继上一次(第一期)的书籍导读直播之后,有部分同学反应上次讲解的书籍还是有点难了,所以第二期的书籍导读马上给大家安排了更加基础、更加简单、更容易理解,更易于接受的数据分析书籍《从Excel到Python——数据分析进阶指南》。

书籍介绍

本书第一章给大家介绍了两种生成数据表的办法,一种是导入外部数据,另一种是通过直接写入数据来生成数据表。Excel中的“文件”菜单中提供了获取外部数据的功能,支持数据库和文本文件和页面的多种数据源导入。Excel中直接在单元格中输入数据就可以,Python中则需要通过代码来实现。

第二章是关于对数据表的检查。维度用shape函数,信息用info函数,数据格式用dtypes和dtype,空缺值用isnull,唯一值用unique,数据表数值用values,列名用columns······

第三章介绍的是对数据表中的问题进行清洗,特别需要注意的一点是处理空缺值的步骤涉及到两个方面,分别是删除和填充。删除用dropna,填充用fillna。填充的时候还可以根据需要去多条件填充。清除空格是strip,这个是用来清除字符串开始和结尾的空格。如果只需要清除左边的就是lstrip,右边是rstrip。大小写转换用lower和upper;修改格式用astype;修改列名称用rename;删除重复值用drop_duplicates();数值修改及替换用replace······

第四章节讲的是数据预处理,这部分主要是介绍数据表的合并和拆分,包括标和表的,列和列的,以及排序、重新设置索引一类。

第五章是数据提取,这部分主要使用3种函数,即loc、iloc和ix。loc函数按标签值进行提取,iloc函数按位置进行提取,ix函数可以同时按标签和位置进行提取。值得一提到是ix函数,它跟iloc一样都是切片函数,但是现在的python版本里面已经取消了ix函数,所以在实际操作中,ix可以替换成iloc。

第六章讲的是数据筛选,使用与,或,非三个条件配合大于,小于和等于对数据进行筛选,并进行计数和求和。与Excel中的筛选功能和countifs和sumifs功能相似。

第七章主要讲解如何对数据进行分类汇总。Excel中使用分类汇总和数据透视可以按特定维度对数据进行汇总,Python中使用的主要函数是groupby和pivot_table,Groupby对分类后的数据可以完成计算函数,比如求和计数,也可以自己define函数。

第八章是数据统计,主要介绍数据采样、标准差、协方差和相关系数的使用方法,和几个统计性函数,sample、describe、std等。

第九章讲了数据输出的两种格式,即xlsx格式和csv格式。

在第二期的书籍导读直播中,我们的老师还就该书中的案例进行了一定的讲解,旨在帮助大家更好地理解数据分析应用。

如果有需要这本书的同学,可以在后台私信我们或者在评论区留言,领取电子书籍。

如果你也对数据分析感兴趣,可以关注我们,我们会在每周四晚七点,准时和大家一起展开书籍导读之旅,动动小手不迷路哦~

—-九道门数据分析师社群—-

发表评论

您的电子邮箱地址不会被公开。