JupyterNotebook目前已快速发展变成大数据分析,机器学习算法的常用工具。因为它能让大数据分析师集中注意力向客户讲解整体分析流程。而在课程内容中以JupyterNotebook的亮相而开头,帮助同学们逐步推进的开展数据统计分析培训教学,学生们可以迅速的熟练掌握数据统计分析而开展企业级的项目开发。
该课程主要是详细介绍一些大数据专业行业领域用Python语言实现的基础库,如简约、轻巧的大数据可视化呈现工具Matplotlib,高效率的计算专用工具Numpy,便捷的数据分析处理专用工具Pandas,为人工智能技术环节打下基础。
课程列表
- 第一天
- 01-环境搭建
- 02-JupyterNotebook介绍
- 03-快速上手JupyterNotebook
- 04-Matplotlib介绍
- 05-快速上手Matplotib
- 06-Matplotlib三层结构
- 07-完善折线图(画布层)
- 08-修改x、y轴刻度
- 09-中文问题解决
- 10-其他辅助显示层完善折线图
- 11-完善折线图(图像层)
- 12-创建多个绘图区
- 13-折线图应用场景
- 14-常见图表及散点图
- 15-柱状图
- 16-直方图
- 17-饼图
- 18-总结
- 第二天
- 01-上节回顾
- 02-今日目标
- 03-Numpy优势
- 04-ndarray属性
- 05-生成数组的方法
- 06-均匀分布与正态分布
- 07-切片索引与形状修改
- 08-类型修改与数组去重
- 09-逻辑运算
- 10-统计运算
- 11-数组间运算
- 12-矩阵运算
- 13-合并与分割
- 14-10操作与数据处理
- 15-总结
- 答疑
- 第三天
- 01-上节回顾
- 02-Pandas介绍
- 03-DataFrame属性和方法
- 04-DataFrame索引设置
- 05-Multilndex与Panel
- 06-Series
- 07-索引操作
- 08-赋值与排序
- 09-算术运算与逻辑运算
- 10-统计运算与自定义运算
- 11-Pandas画图
- 12-CSV文件的读取与存储
- 13-hdf5文件的读取与存储
- 14-json文件的读取与存储
- 15-总结
- 第四天
- 01-上节内容回顾
- 02-今日安排
- 03-处理np.nan类型的缺失值
- 04-处理其他标记的缺失值
- 05-数据离散化
- 06-按方向合并pd.concat()
- 07-按索引合并pd.merge0
- 08-交叉表与适视表
- 09-分组与聚合
- 10-综合案例
- 11-总结