《数据科学基础模拟实训》教学大纲
一、课程的基本描述
课程名称: 数据科学基础模拟实训
课程编号: B06250034
课程类型: 实践课 适用专业: 金融科技
参考教材: 理论 1.张良均,谭立云.Python数据分析与挖掘实战(第2版)[M].北京:机械工业出版社.2019.
2.张健,张良均.Python编程基础[M].北京:人民邮电出版社.2018
3.卫斯理春(美).《Python核心编程(第2版)》人民邮电出版社.201502
实验
总 学 时: 学时 理论学时: 学时 实践学时: 学时
总 周 数: 1周
学 分: 1学分 建议开课学期: 第4学期
前导课程: 计算机应用基础、Python程序设计
后续课程: 大数据技术与征信、Python金融数据分析
课程简介
数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助。数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略新兴产业。有实践经验的数据分析人才已经成为了各企业争夺的热门。为了推动我国大数据,云计算,人工智能行业的发展,满足日益增长的数据分析人才需求,开设数据科学基础模拟实训来增加学生的实际知识运用能力。
二、课程目标定位
(一)课程教学目标
课程目标1.通过实验教学使学生能够利用计算机编程工具,对机器学习的各种算法及应用有一个直观的了解和学习,并通过观察实验结果验证算法的正确性。
课程目标2.培养学习发现问题和解决问题的能力,使学生能够在实践中加深对理论的理解。
(二)课程目标与毕业要求的关系
表1 本课程对毕业要求及其指标点的支撑
毕业要求 毕业要求指标点 课程目标
1 2 3 ...
2.专业性知识 能利用Python进行数据清洗,掌握所需要的计算机科学与技术的跨学科知识。 √
6.知识应用能力 能够对Python代码进行CRUD,独立分析问题,解决问题。 √
11.专业素养 能用计算机思维思考问题,解决问题 √ √
三、教学内容与基本要求
(一)实践部分
表3 课程实践教学内容与课程目标的关系
序号 实践名称 实践类型 实践目的及内容提要 基本要求 推荐周数 安排方式 对应课程目标
1 Python数据分析概述 集中实践 1. 掌握Jupyter Notebook的基础功能
- 掌握Jupyter Notebook的高级功能 1. 掌握Jupyter Notebook的常用功能 0.2 上机 1、2、3
- NumPy数值计算基础 集中实践 1. 创建数组对象
- 生成随机数
- 通过索引访问数组
- 变换数组的形态
- 创建NumPy矩阵
- 掌握ufunc函数
- 读写文件
- 使用数组进行简单的统计分析 1. 掌握NumPy创建多维数组与生成随机数的方法
- 掌握数组的索引与变换
- 掌握NumPy中数组矩阵的运算及通用函数的基本使用方法 0.2 上机 1、2、3
- pandas统计分析基础 集中实践 1. 查看DataFrame的常用属性
- 查改增删DataFrame数据
- 描述分析DataFrame数据
- 转换字符串时间为标准时间
- 提取时间序列数据信息
- 加减时间数据 1. 掌握常见的数据读取方式
- 掌握DataFrame常用属性与方法
- 掌握基础时间数据处理方法 0.2 上机 1、2、3
- 使用pandas进行数据预处理 集中实践 1. 堆叠合并数据
- 主键合并数据
- 重叠合并数据
- 检测与处理重复值
- 检测与处理缺失值 1. 掌握数据合并的原理与方法
- 掌握数据清洗的基本方法
- 掌握基本数据标准化的方法
- 掌握常用的数据转换方法 0.2 上机 1、2、3
- 使用scikit-learn构建模型 集中实践 1. 加载datasets模块中的数据集
- 将数据集划分为训练集和测试集
- 使用sklearn转换器进行数据预处理与降维
- 使用sklearn估计器构建聚类模型
- 评价聚类模型
- 使用sklearn估计器构建分类模型
- 评价分类模型
- 使用sklearn估计器构建回归模型
- 评价回归模型 1. 掌握sklearn转换器的使用方法
- 掌握sklearn估计器的使用方法
- 掌握聚类模型的构建与评价
- 掌握分类模型的构建与评价
- 掌握回归模型的构建与评价 0.2 上机 1、2、3
四、作业设计
知识单元 题型 涵盖的主要内容 目的 要求
Python数据分析概述 小作业 1. Jupyter Notebook的基础功能
掌握数据分析的概念、流程与应用场景 小作业:侧重于巩固当节课所学的重要知识点
熟悉开发环境
NumPy数值计算基础 大作业 1. 创建数组对象- 生成随机数
- 通过索引访问数组
- 变换数组的形态
- 创建NumPy矩阵 小作业:侧重于巩固当节课所学的重要知识 对于Numpy熟练的创建与运用。
pandas统计分析基础 小作业 1. 查看DataFrame的常用属性 - 查改增删DataFrame数据
- 描述分析DataFrame数据
- 转换字符串时间为标准时间 小作业:侧重于巩固当节课所学的重要知识 input,print函数的使用
使用pandas进行数据预处理 大作业 1. 堆叠合并数据
- 主键合并数据
- 重叠合并数据
- 检测与处理重复值 综合性大作业:数据类型的理解 掌握数据合并的原理与方法
掌握数据清洗的基本方法
使用scikit-learn构建模型 大作业 1.用sklearn估计器构建聚类模型
用sklearn估计器构建分类模型
综合性大作业:侧重于对于用scikit-learn构建模型的使用方法,提高综合分析能力 掌握构建模型的数据处理方法,全面分析数据
五、课程考核与成绩评定
1.考核方式及成绩评定
(1)考核方式
期末考试为100分钟的闭卷考试,卷面成绩满分100分。
(2)平时成绩
主要根据作业完成情况进行评定,综合考虑回答问题、考勤、课堂纪律等影响因素,占总成绩的20%。
(3)期末成绩
考核学生熟练掌握所学的重要知识点,运用人工智能与机器学习涉及的基本原理、方法对出现的问题进行独立判断、分析和研究的能力,支撑课程目标1、2、3,主要题型为选择题、简答题和案例分析等,占总成绩的80%。
2.考核评价的标准
(1)平时成绩评分标准
考核
内容 5分 4分 3分 2分 1分 0分
出勤 按时到课 请假 迟到或早退 旷课
作业完成程度 在规定时间内高质量完成 在规定时间内完成,但有个别错误 在规定时间内完成,但有少量错误 在规定时间内完成,但是错误较多 在规定时间内完成,但是有严重错误 不交
平时课堂表现 主动参与课堂活动,且互动频繁 课堂表现消极,参与互动次数欠佳 不参与互动
注:总成绩=平时成绩(20%)+期末成绩(80%)
其中:平时成绩=出勤(30%)+作业(50%)+平时课堂表现(20%)出勤(单次满分5分,合计考核6次)、作业(单次满分5分,合计考核10次)、平时课堂表现(单次满分5分,合计考核4次)
(2)考试成绩评分标准
详见当年试卷的《标准答案及评分标准》。
3.课程考核对课程目标的支撑
考核环节 分值 考核内容与评价细则 课程目标1 2 3
平时成绩 20 1.主要考核学生对每知识单元知识点的理解、掌握和灵活运用程度。
2.平时每次作业按5分制单独评分,最终成绩折合为百分制成绩。 √ √ √5 10 5
期末考试 80 卷面成绩满分100分,以卷面成绩乘以0.8计入课程总评成绩。 √ √ √
20 45 15
合计:100分 25 55 20
制定(修订)人: 审核人: 院长(主任):
制定(修订)时间: 审核时间: 批准时间:
评论 (0)