Python 数据分析实战教程目录
第1章 数据分析入门与环境搭建
1.1 为什么学习数据分析:应用场景与职业前景 1.2 数据分析工作流程概览:从问题定义到洞察输出 1.3 核心工具链介绍:Python、Jupyter、pandas、NumPy、Matplotlib、Seaborn 1.4 安装与配置数据分析环境(含 conda 虚拟环境与镜像源设置)
第2章 NumPy 数组基础
2.1 NumPy 数组基础:ndarray 创建与属性 2.2 数组索引、切片与布尔索引 2.3 向量化运算与广播机制 2.4 常用数学函数与随机数生成
第3章 pandas 核心数据结构
3.1 pandas 核心数据结构:Series 与 DataFrame 3.2 从 CSV、Excel、JSON 读取数据 3.3 查看数据基本信息:head、info、describe 3.4 列选择、行筛选与条件查询
第4章 数据清洗与预处理
4.1 处理缺失值:isna、dropna、fillna 4.2 删除重复数据与异常值识别 4.3 数据类型转换:astype 与 to_numeric 4.4 字符串操作与正则表达式清洗
第5章 数据变换与特征工程
5.1 新增列与列重命名 5.2 行/列排序与索引重置 5.3 数据分箱与离散化处理 5.4 日期时间类型处理与解析
第6章 分组聚合分析
6.1 分组聚合:groupby 基本用法 6.2 聚合函数:sum、mean、count、agg 6.3 多级分组与分组后过滤 6.4 透视表(pivot_table)创建与解读
第7章 数据合并与重塑
7.1 数据合并:concat 横向与纵向拼接 7.2 主键连接:merge 的 inner、left、outer 7.3 索引对齐连接与多列连接 7.4 长宽表转换:melt 与 pivot
第8章 Matplotlib 基础可视化
8.1 Matplotlib 基础绘图:折线图、柱状图、散点图 8.2 图形元素定制:标题、标签、图例、网格 8.3 子图布局:subplot 与 subplots 8.4 保存图表为图片文件
第9章 Seaborn 统计可视化
9.1 Seaborn 统计图表优势简介 9.2 分布可视化:histplot、kdeplot、boxplot 9.3 关系可视化:scatterplot、lineplot、relplot 9.4 分类数据可视化:barplot、countplot、violinplot
第10章 探索性数据分析(EDA)
10.1 相关性分析:corr 与热力图绘制 10.2 时间序列趋势分析与移动平均 10.3 分组对比分析与交叉表 10.4 异常检测与离群点识别方法
第11章 分析报告与项目组织
11.1 使用 describe 进行整体统计概览 11.2 构建自定义分析函数与管道 11.3 生成分析报告:Markdown + 图表整合 11.4 使用 Jupyter Notebook 组织分析项目
第12章 综合实战案例
12.1 电商用户行为数据分析实战 12.2 股票价格时间序列分析 12.3 社交媒体情感倾向探索 12.4 公共数据集(如 Titanic、鸢尾花)完整分析流程