目的:
- 工具专精:掌握Python核心库(Pandas/Statsmodels/Scikitlearn)在经济数据处理、建模、可视化中的全栈能力
- 实证研究闭环:实现从经济数据获取→清洗→探索性分析→计量建模→策略模拟→可视化报告的完整工作流
- 前沿技术融合:训练机器学习方法(如Lasso/RF)与经济计量模型(OLS/IV/DID)的交叉应用能力
就业竞争力构建:培养符合金融科技、量化策略分析岗位需求的Python实证能力和数据分析能力
主要内容:
模块1:Python经济数据分析基础
环境搭建 Anaconda配置 + Jupyter Lab操作 + 经济学专用库安装(pip install pandas statsmodels linearmodels)
数据获取与清洗 使用pandas读取Excel/CSV/数据库(连接Wind/国家统计局API)
经济数据清洗:缺失值插补(fillna())、异常值处理(分位数缩尾winsorize)
特征工程:计算同比/环比增长率、实际利率(名义利率CPI)
数据探索分析 经济指标描述统计:df.describe()
收入分布可视化:seaborn.kdeplot()绘制洛伦兹曲线
区域经济对比:matplotlib绘制多省份GDP箱线图
模块2:计量经济学建模实战
经典回归分析 OLS回归:statsmodels.OLS() 分析教育回报率(log(工资) ~ 教育年限 + 工作经验)
虚拟变量:研究性别工资差异(添加gender哑变量)
时间序列分析 ARIMA预测CPI:statsmodels.tsa.ARIMA() + 季节性分解seasonal_decompose
格兰杰因果检验:分析美联储加息与新兴市场汇率波动
面板数据模型 固定效应模型:linearmodels.PanelOLS 评估各省环保政策对工业增长的影响
双重差分法(DID):linearmodels.DifferenceInDifferences 量化“碳交易试点”政策效应
内生性处理 工具变量法(2SLS):linearmodels.IV2SLS 研究基建投资对GDP的因果效应(用历史气温作工具变量)
模块3:高级应用与可视化
机器学习扩展 Lasso回归预测通胀:sklearn.LassoCV() 筛选宏观经济预测指标
随机森林评估金融风险:sklearn.RandomForestClassifier() 识别企业违约信号
动态经济可视化 宏观经济仪表盘:plotly绘制交互式GDP/失业率趋势图
空间经济分析:geopandas+contextily绘制区域人均收入热力图
文本经济分析 央行政策文本情感分析:sklearn.TfidfVectorizer() + LDA主题建模
经济新闻与股市波动关联性检验
自动化报告 可复现研究:Jupyter Notebook输出完整分析流程
自动化报告:nbconvert生成PDF分析报告
模块4:综合课题实战(Python全流程)
可以参考之前写过的文章:
基于Python的実証経済学(じっしょうけいざいがく)応用https://www.panglizhi.cn/index.php/archives/66/
选题示例(需提交完整代码+经济解释报告):
# 案例:货币政策传导效应分析 import pandas as pd from linearmodels import PanelOLS # 1. 数据准备 df = pd.read_excel("macro_data.xlsx", index_col=["省份","年份"]) # 2. 构建面板模型 model = PanelOLS.from_formula("工业增加值增长率 ~ 1 + 货币供应量增长率 + EntityEffects + TimeEffects", data=df) results = model.fit(cov_type='clustered', cluster_entity=True) # 3. 结果解读 print(results.summary) # 输出弹性系数及显著性
通过网盘分享的文件:macro_data.xlsx
链接: https://pan.baidu.com/s/11q9DuWVO4dz8WpVpPATiwQ?pwd=nwng 提取码: nwng
课题方向:
中国货币政策的区域异质性效应
数字经济对传统产业就业的替代效应(使用微观调查数据)
国际大宗商品价格波动对PPI的传导路径分析
评论 (0)