首页 > 新闻中心
新闻中心

【SNAI课堂】为灵感插上双翼——全日制《数量分析方法》课程侧记

发布时间:2019-11-30

(撰稿:郭若仪,摄影:刘荣光)“处暑”到“小雪”,残暑到新凉。《数量分析方法》作为本学期课时最长,选课人数最多的“网红”课程,在初冬落下了帷幕。

  从我们告别高中校园,迈入本科校园,“数据”就开始出现在我们的学习生活中。而我们真正被宣布成为经管学科研究生的那一刻,意味着之后的学习工作生涯都要与“数据”绑定。课程论文、现象研究、毕业设计……研究生阶段的学习不再仅限于老师授课,更需要自我钻研与发现。然而,不管是读懂一份结论明了的研究报告,还是开始着手于对某个经济现象的研究,我们都要掌握和“数据”相处的技巧。虽然《数量分析方法》被列为选修课程,但它确实是我们需要掌握的一项技能。

很多人认为统计学很晦涩,因为需要高等数学的辅助推导;觉得数据很枯燥,认为它们只是十个基本数不同排列的堆叠,比起音频、影像,它们连存储空间都有限。但正是这一门被认为“烧脑”又枯燥的课程,在两位老师的讲授下显得颇有趣味。《数量分析方法》的教学分为两部分,第一部分是统计学原理在经济研究中的运用,由郑德渊老师主讲;第二部分是实践课,由赵春光老师向我们介绍数据处理的方法以及统计软件的操作。《数量分析方法》更加注重实践运用,这就大大提高了课程内容的趣味性。另外,两位老师的温和、细心与风趣的讲解,也使课堂氛围变得轻松、愉快。

“只要你有灵感与好奇心,模型、方法、软件都会帮你实现”。这是两位老师一直强调的。统计学原理、经济学模型与统计学软件怎样服务于我们的思想?面对庞大的数据库我们应该如何下手?两位老师从经典的实证研究案例出发,将“数量分析”从高台上拉下,帮助我们将它锤炼成为利器。

一、 数据筛选的陷阱——“幸存者偏差”

郑德渊老师用飞机维护的例子对“幸存者偏差”做出了直观解释。二战期间,部队维修师们发现幸存的作战机体机翼中弹多而机身中弹少,所以决定重点加固飞机的机翼以防御攻击。其实不然,作战机在机翼严重受损的情况下能够安全返航恰恰证明了机毁的最重要原因并非机翼受损,维修师们并没能看到战毁的飞机,只要他们找到那些没有返航的飞机残骸,就会发现战机的致命伤在机身。

“幸存者偏差”指的是只能看到经过某种筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息,这是一种常见的逻辑谬误。而我们在数据收集时,也很容易掉入“幸存者偏差”的陷阱。这在样本筛选时尤为常见,如果以收入/利润为筛选门槛,大企业强者恒强,小企业每况愈下。那些状况差的企业被剔除,最后就会得到乐观的结论。

二、 双重差分模型——政策运行的有效性的评估

在双重差分模型的专题学习中,郑老师向我们讲解了1995KielMcClain的经典研究案例。1978年,有传言北安德沃市将建造一座垃圾焚烧炉,于1981年开始动工,人们认为垃圾焚烧炉动工后不久就会开始运转,事实上直到1985年焚烧炉才正式运行。我们基于常理推测,近焚烧炉的房子房价会因为传闻下跌。如果我们利用1981年(焚烧炉动工)的数据按“远焚烧炉”与“近焚烧炉”的标准将房子分成两类,就很容易建立起这样一个模型:

(1)

其中,nearinc是“远/近焚烧炉”的虚拟变量(nearinc=1则远离焚烧炉,nearinc=0则靠近焚烧炉)。通过回归得到=30688.27,说明远焚烧炉的房子的平均价格比近焚烧炉房子的平均价格贵了$30688.27。从而证明建造焚烧炉确实对周边房价造成了影响。

然而,当我们利用1978年(尚无建造焚烧炉传言)的数据带入模型分析后,也得到了相似的结论:=18824.37,说明在建造焚烧炉的传闻流行以前,远、近焚烧炉选址房子的价格差异就已经存在。这样一来,我们又怎么能说是“传闻”影响了房价呢?

此时我们需要关注的是nearinc的系数1978年与1981年间的变化。就是焚烧炉对周边房价影响的估计量,经验经济学将被称为倍差估计量,简单来说,就是两个区位住房价格的差价在不同时期的差别,代表着房价的“现有差异”,代表房价的“固有差异”,两个“差异”的差值 才能说明焚烧炉传言是否对周边房价产生了影响。对“差”再“作差”,这也是双重差分的命名由来。

我们需要通过回归分析,检验是否显著异于零。建立模型:模型(2)

1978年与1981年的数据一起进行回归,模型会帮助我们判断年份。对于1978年的数据,模型判定y81=0,1981年的数据,模型判定y81=1.


1 Stata对模型(2)的回归报告

1 回归结果解读

1978y81=0

1981年(y81=1

1981年与1978年之差

距垃圾焚烧炉远

(nearinc=0)

82517.23

82517.23+18790.29

18790.29

距垃圾焚烧炉近

(nearinc=1)

82517.23-18824.37

82517.23+18790.29-18824.37-11863.90

18790.29-11863.90

近与远之差

-18824.37

-18824.37-11863.90

-11863.90

注:图1与表1来自主讲教师课件

通过对模型(2)中各系数的解读,我们发现交叉项y81nrinc的系数是我们要寻找的真正体现传闻对房价影响的系数。通过回归结果我们可以得知,虽然系数小于零,但却缺乏统计显著性,无法拒绝“倍差系数等于0的原假设”。

掌握了双重差分模型的原理之后,郑老师还向我们介绍了其他双重差分法的应用场景。当探究政府政策的变更对企业或城市运行的环境的影响时,我们可以收集政策改变以前和改变以后两个年份的数据,将样本分为四组(变化前/后的对照组,变化前/后的处理组)进行讨论。又或者,我们想要探究策略的有效性,比如菜单上的“店家推荐”是否会增加销量;“安慰剂”是否能够产生作用……双重差分模型都能帮我们实现。

三、描述性统计/非参数检验——找到灵感的好帮手

“描述性统计”一直被认为是实证论文中最方便“堆图表、凑字数”的部分,而赵老师改变了我们对“描述性统计”的狭隘认知。建模、回归是我们验证猜想的方法,而猜想来源于在观察中发现的“差异”。我们想探究影响薪酬的因素,其起源是我们发现了不同职位、性别、学历的员工的薪酬不同。因为有了“差异”,我们才能够发现问题,从而运用一系列模型进一步挖掘。

SPSS是整理数据的能手,通过“比较均值”选项,我们能够轻松在数万条数据中直观地看见差异。


2 SPSS统计报告:高管薪酬差异(1)


如图2,我们以报告期薪酬(comp)作为因变量,以高管职务类别、性别作为层变量,发现兼任CEOCFO的高管(3)平均薪酬最高,CEO(1)次之,最低是CFO(2);我们还发现不管是哪一种职务,男性(1)高管的工资都要高于女性(0)。我们还可以在层变量中加入“学历”,观察结果。

3 SPSS统计报告:高管薪酬差异(2) 截取

通过观察图3,我们发现不管是男性CEO还是女性CEO,持有博士学位(5)的平均薪酬最高,除此以外,学历与薪酬间的差异规律并不明显。

我们还发现,担任管理层职位的人员中,男性要远远多于女性,本科学位(3)与硕士研究生学位(4)占大多数,不同公司付给高管人员的薪酬差异也很大。描述性统计报告能够给予我们许多信息,统计软件整理信息的能力越强,我们能够观察到的信息就越多,从而越有助于激发我们的灵感。

四、 SPSS逐步回归——变量选取少费心

拟合优度(R2)是我们在进行多元回归时考虑的重要因素。它是指回归方程对观测值的拟合程度。R²最大值为1。一般认为,R²的值越大,回归方程对观测值的拟合程度越好;反之则说明回归方程对观测值的拟合程度越差。但是一味追求更高的拟合优度并不妥当。两位老师告诉我们,对回归模型拟合优度的评价首先要基于模型目的,如果模型用作预测,对R2的要求较高;如果模型仅仅用于解释,即更看重变量的符号表现,那么对R2的要求可以放宽。其次要区分学科背景,自然科学统计中的R2一般要大于社会科学统计中的R2

在明确了目的与背景以后我们对拟合优度也就有了更加合理的预期。但是,如果我们在变量选取环节出现了差错,模型的R2就会低于已有研究的经验值。这时我们就应当考虑,是否缺少关键变量或增加了冗余变量。删减、添加变量再重新回归的重复工作虽然简单但费时费力,这时SPSS逐步回归就能够帮助我们快速确定最佳拟合优度的变量选择方案。

以公司股价为例,哪些因素会对股价产生影响?已有的研究结论与理论基础告诉我们,公司规模、资本结构、风险系数等都可能影响企业的股价。但我们也好奇每股净资产、现金流、每股净收益会不会对企业股价产生作用,却又担心变量不具有统计相关,甚至对模型造成损害。这时我们就可以将备选变量都放入模型,让SPSS为我们做出决策,选出具有最优拟合优度的估计模型。

除了上述内容以外,两位老师还与我们分析了股票市场中“追涨杀跌”与“高抛低吸”策略的有效性;分享了Excel在统计学中的应用与问卷设计的学问;含有定性(或虚拟)变量的多元回归分析……值得一提的是,我们还能通过课堂演示观察到老师们整理与处理数据的小技巧,从而大大提高了我们的操作效率。

郑老师在教学中鼓励我们不局限于讲义,不局限于课后习题,要培养对经济现象的灵敏嗅觉。“模型有很多,统计软件有很多,数量分析的方法也有很多,最珍贵的是你的灵感与思路”,大家也因此受到鼓舞,在事件研究法的专题学习中,各小组分别对感兴趣的话题展开了研究:

2 小组作业展示(事件研究法专题学习)

组别

选题

1

苏宁宣布上线网购平台对其股价的影响

2

限售股解禁对股价的影响

3

中美贸易战对宝钢股份的影响

4

上市公司公布摘帽后的股价表现

5

处罚事件对浦发银行股价的影响

6

“漂绿”事件对中石油股价的影响

7

马云卸任对阿里巴巴股价的影响

8

环保政策颁布对污染型上市公司股价的影响

9

刘强东事件对京东股价的影响

10

中石油“漂绿”对其股价的影响

事件研究法是利用估计窗口的数据建立模型,从而对事件窗口进行估计。通过分析事件窗口估计值与实际观测值的差异,来评价“事件”、“消息”、“政策”是否产生了影响。

从数据获取、数据处理,到数据观察、模型选择、报告解读,再到最后形成初步结论,实证研究的每一步都需要统计学原理维护其科学性与客观性。十二周的课程,说长不长,说短也不短。通过对经典实证论文的分析解读与课后任务布置,两位老师帮助我们梳理了实证分析的一般流程,使我们初步具备了数量分析的能力,同时为我们今后进行实证研究打下了基础。






微信
  • 上海国家会计学院
    微信二维码
  • 财政部
    微信二维码
  • 上海国家会计学院
    手机网站