-->
深度报道
您所在位置:首页 > 走进SNAI > 新闻中心 > 深度报道
【SNAI课堂】工欲善其事,必先利其器—2023级全日制研究生《机器学习》课程侧记
日期:2023-11-24

(撰稿/摄影:鄂吉亚)在这样一个快速发展的时代,机器学习在当今数据丰富的世界中已经开始发挥关键的作用。机器可以帮助筛选出有助于获得重大突破的有用信息,这种技术在各行各业中已经广泛应用,如金融,医疗,保险,制造,转型变革等。

《机器学习》这门课程主要内容是教授同学们如何运用机器学习的理论与算法对大量的数据集进行处理和分析。它主要面向大数据与会计专业以及其他有兴趣了解机器学习相关知识的同学,以R语言作为数据处理媒介,结合数学、统计学、计算机科学等多学科的相关知识,介绍基础的机器学习算法与技术并将其运用到实践中解决实际问题。

该课程由复旦大学大数据学院林晓蕾副教授主讲。林老师有着清晰的课程框架,新颖的教学方式,渊博的理论知识和丰富的实践经验。在授课过程中,林老师将理论与实操相结合,让同学们对机器学习有了基础的认知和初步的了解。

一.选择模型,一切的起点

机器学习的主要思路在于利用一些训练数据,使得机器能够利用他们分析未知数据,就好像是利用已经做过的题目找到相应的解题方法,然后去应对考场的题目一样。机器学习就是让机器从大量的数据集中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好。

在机器学习领域,学习任务可以大致分为三类,一种是监督学习,一种是非监督学习,另一种是强化学习。本课程主要以监督学习为主,即根据已有的数据集,知道输入和输出结果之间的关系。而监督学习又包括回归(Regression)和分类(Classification)两种。回归问题是针对于连续型变量的,比如预测美国加州的房价,具体可以通过线性回归模型进行。分类和回归最大的区别在于,分类是针对离散型变量,输出的结果是有限的,比如预测信用卡是否会违约,通过向模型中输入各种数据的样本,产生“输入一个人的数据,判断是否会违约”的结果,结果必定是离散的,只有“是”或“否”,最为经典的分类算法就是逻辑回归模型。因此,只有根据具体的问题去尝试相应的模型,才能够更好的达到预期效果。

二.没有测量,就没有科学

仅仅选择出一个模型仍是远远不够的,在机器学习中,需要选择与问题相匹配的评估方法,从而快速发现模型选择或训练过程中出现的问题。准确率、精确率、召回率是评估模型中常见的三个指标,此外还有ROC曲线等等。K-fold交叉验证是最常用的交叉检验方法,原理是将数据集分为训练集和验证集两个部分,在训练集中对数据进行模型的拟合,然后在验证集中做出预测,计算两者的RMSE,然后得出最小的RMSE的模型即为最佳模型。

三.工欲善其事,必先利其器

本课程采用的编程软件是R语言。在林老师的带领下,我们熟悉了什么是编程语言,如何运用这门语言来完成编程。在整个过程中都需要极度的耐心与细致,因为一个字符的错误就无法完成任务,甚至有时程序报错,看代码不够细心都找不出问题所在。通过不断的练习,我们越来越注重写代码时的语言和逻辑,逐渐变得游刃有余。

《机器学习》课程的学习,让我们收获到的不单单是编程技能,更多的是一种思维方式。在大数据时代,在智能技术的推动下,会计的数字化转型已经势在必行,作为一名未来的会计从业人员,主动学习、掌握、应用机器是非常有必要的!



微信
  • 上海国家会计学院
    微信二维码
  • 财政部
    微信二维码
微博