(撰稿/摄影:杨思佳)当今,无论是从事理论研究还是探索现实问题,如何利用好收集的数据来进行分析与验证是许多人必不可少的技能之一。《数量分析方法》作为一门全日制会计硕士可选的课程,受到众多学生的喜爱与欢迎,在课程中老师们精彩的讲述带领我们初识由数据假期的假设与结论之间的桥梁,帮助我们了解到统计方法在财务会计、财务会计、经济金融等领域的运用,并得以通过动手上机操作对感兴趣的问题展开探究。
本学期的《数量分析方法》课程主要分为两个部分,前半部分由苏宏通老师向我们介绍了统计方法的理论知识,包括描述性统计、相关分析、区间估计、假设检验、回归分析等,为我们后续的学习打下了坚实的基础;后半部分由赵春光老师带领我们一起学习使用Excel与SPSS软件,将前半部分课程的理论知识付诸于实际,通过对原始数据进行丰富的处理后获得研究所需要的数据,最终我们得以利用习得的新技能对感兴趣的上市企业经管问题展开独立研究。两部分的课程尽管形式不同,但丰富有趣的内容都开阔了我们的视野,学到了新的分析问题的思路与方法。
一、如何观察数据?——描述性分析
经济数据的类型可以分为横截面数据、时间序列数据、以及面板数据。描述性统计指将调查样本中的包含的大量数据资料进行整理、概况和计算,实际上就是将获得的数据以读者易于理解的方式进行汇总与披露的过程,其分析过程主要包括数据的频数分析、集中趋势分析、离散程度分析、分布以及一些基本的统计图形。在本课程学习中,我们对数据进行描述性统计的过程时常用的标准包括平均数、中位数、众数、极值、分位数、方差等等。描述性统计是一个能够直观观察数据的方法,在研究中应用广泛,也十分便于理解。
通过在SPSS软件中选择“描述统计”或“比较平均值”选项,我们能够便利地将已获得的几万条数据按需要的方式进行处理,从而对手头数据有一个更直观的认识。例如下表将2012-2021年10年间的我国上市公司所得税率数据进行了处理,可以发现,这38594条原始数据中,有超过一半的数据因不符合条件而被剔除,剩余的16695个所得税率数据可以按照不同年份进行平均值与标准差的描述,从而直观的看到近十年来我国企业支付税率的总体情况,比起原始数据的杂乱,经过简单处理后数据已在一定程度上能够展示一些简单结论。
个案处理摘要 |
||||||
|
包括 |
排除 |
总计 |
|||
个案数 |
百分比 |
个案数 |
百分比 |
个案数 |
百分比 |
|
taxrate*year |
16695 |
43.3% |
21899 |
56.7% |
38594 |
100.0% |
报告 |
|||
taxrate |
|||
year |
平均值 |
个案数 |
标准偏差 |
2012 |
.1514 |
2353 |
.19661 |
2013 |
.1506 |
2406 |
.20447 |
2014 |
.1462 |
2499 |
.21629 |
2015 |
.1332 |
2682 |
.22772 |
2016 |
.1649 |
770 |
.21811 |
2017 |
.1711 |
598 |
.23362 |
2018 |
.1491 |
749 |
.23032 |
2019 |
.1523 |
1148 |
.26571 |
2020 |
.1626 |
1557 |
.23834 |
2021 |
.1287 |
1933 |
.23861 |
总计 |
.1473 |
16695 |
.22402 |
除此之外,描述性统计结果的常见表达形式包括直方图、柱状图、折线图、饼图、散点图等等。图像的使用能够使读者更为清晰的了解数据的特征,从而起到辅助解释结果的效果。在课程实操学习过程中,我们在老师的带领下使用软件根据不同数据的特点以及传递不同结论的意图制作出了各种图像。
二、如何使用数据?——假设检验与回归分析
对获得的数据进行直观的描述只是我们展开统计研究的第一步,为了得到几百、几千、甚至几万条数据之间的关系,我们接下来可以从假设检验入手。假设检验,又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。假设检验的主要思想是逻辑上运用反证法,统计上依据小概率原理,即小概率是在一次试验中,一个几乎不可能发生的事件发生的概率,因此在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。对于假设检验的结果,我们可以将其描述为统计上显著或不显著。其中,统计上显著指的是拒绝原假设,这是指一种“非偶然性”,只有在原假设非真时才能得到。
通过利用假设检验的思想,我们进一步学习了一元回归分析方法与多元回归分析方法,从而能够在统计软件的帮助下得到两个及以上变量之间的关系。在课程理论学习过程中,苏老师为我们举了很多有趣的研究例子,例如影响薪资的因素与薪资产生的影响——教育程度与薪资的影响、性别是否导致了薪资的差异、CEO薪资与销售收入的关系等。
例如,在SPSS软件实操课程中,赵老师带领同学们利用多元回归分析探索了2012年-2021年我国上市公司股票年收盘价与EPS、公司规模、企业偿债能力、控制权等因素的关系。如下表所示,以年收盘价与EPS的关系为例,可以看到两变量显著正相关(p值<0.01),同时公司EPS每增加1元,年收盘价将增加约23.63元。通过类似的研究,我们可以利用已有数据探索各类感兴趣的问题,并发现不同变量间是否存在关系,以及究竟存在怎样的关系。
系数 |
|||||||
|
未标准化系数 |
标准化系数 |
|
|
共线性统计 |
||
|
B |
标准错误 |
Beta |
t |
显著性 |
容差 |
VIF |
(常量) |
83.223 |
2.347 |
|
35.454 |
.000 |
|
|
eps |
23.627 |
.232 |
.513 |
101.926 |
.000 |
.904 |
1.106 |
year=2012 |
-14.005 |
.735 |
-.109 |
-19.056 |
.000 |
.699 |
1.430 |
year=2013 |
-11.546 |
.735 |
-.090 |
-15.716 |
.000 |
.700 |
1.428 |
year=2014 |
-8.315 |
.724 |
-.066 |
-11.488 |
.000 |
.693 |
1.444 |
year=2015 |
1.319 |
.703 |
.011 |
1.876 |
.061 |
.675 |
1.482 |
year=2016 |
-4.055 |
.686 |
-.035 |
-5.908 |
.000 |
.662 |
1.510 |
year=2017 |
-8.232 |
.657 |
-.075 |
-12.525 |
.000 |
.635 |
1.574 |
year=2018 |
-11.730 |
.655 |
-.108 |
-17.916 |
.000 |
.628 |
1.592 |
year=2019 |
-7.666 |
.646 |
-.072 |
-11.870 |
.000 |
.620 |
1.614 |
year=2020 |
-2.569 |
.628 |
-.025 |
-4.090 |
.000 |
.603 |
1.660 |
size |
-3.091 |
.112 |
-.143 |
-27.585 |
.000 |
.857 |
1.167 |
lev |
-.902 |
.405 |
-.011 |
-2.227 |
.026 |
.939 |
1.065 |
bvps |
-.002 |
.001 |
-.011 |
-2.319 |
.020 |
.997 |
1.003 |
控制权比例 |
-.030 |
.011 |
-.014 |
-2.819 |
.005 |
.933 |
1.071 |
通过一学期的精彩课程,同学们对数据分析与实证研究的方法有了初步的了解,不仅习得了未来学习与工作的重要技能,更对个人思考问题的角度、方式、思路有了新的拓展,收获颇多。