-->
深度报道
您所在位置:首页 > 走进SNAI > 新闻中心 > 深度报道
【众华青牛论坛专家观点】解飞:人工智能技术行业应用
日期:2023-11-29
  11月3日,上海国家会计学院第一届众华青牛论坛成功举办。科大讯飞子公司科讯嘉联副总经理解飞结合科大讯飞相关产品在医疗、教育、农业等行业的应用情况,分享了人工智能的行业应用。

  科大讯飞把AI应用分为三个层次,运算智能是让机器能存会算.感知智能是让机器能听会说能看会认,认知智能是解决机器能理解会思考的问题。语言、图象识别等领域中AI的技术在算力和数据的加持之下已经都超过了人类。2018年,科大讯飞推出的语音识别机器人已经能够每分钟识别超过600字,正确率达到98%,超过专业速记员的水平。

  一项人工智能技术在运用到真正场景之前跟在实验室中有很大差异,例如说语音识别技术,在日常的生活工作场景中应用通常会有有英文、中文或方言混语的语境,需要模型具有很强的适配。科大讯飞的工程师采用了迁移学习能力,在很少的粤语和英文的能力下可以实现跟中文一样好的效果,能够达到整体90%以上的准确率。在每个单点技术或场景下达到95-99%的可用度之后,全链条的多项能力集成,是需要长期的打磨和发展才能形成一个好用的方案。

  语音合成技术也是感知智能的重要能力,目前已经在很多AIGC场景应用,语音合成技术已经接近真人主播水平。通过AI生成方式在央视节目中使用过机器人配音技术,进行任意内容的播报,在算力足够多的情况系生成高保真的声品,已经很难听出来和专业播音员的差异。基于科大讯飞最新语音合成深度学习技术,只需要提供少量的干净录音数据,机器就可以快速学习并生成可使用的语音合成音库,提供专属的、独一无二的合成声音。最近算法正在持续进行工程优化,现在对算力的支持能够进一步降低,在讯飞开放平台上面向个人用户也开放了训练,有10分钟左右的语音就可以训练每个人的个性化音库,可以用自己的声音复刻所有的内容播报。

2009年以前数字人运用在高保真的电影制作中,制作成本和周期非常大。例如电影《阿凡达》中的很多场景是通过AI能力训练的,每一分钟花费金千万美元的成本。2010年以后,技术上取得了长足的突破,基于统计学的模型,能够用很小的算力成本,把图形能够复刻到一个VR设备里。科大讯飞与上海太保合作构建了保险代理人的应用,可以使每一个代理人都有自己的数字分身。

  随着算法和技术的逐渐完善,AI在医疗、教育、司法等行业逐步开始应用。在医疗上,通过AI的方式对医院全量住院和门诊的病例信息和用药信息进行质检,能够把本来没有必要服用的药以及没有必要过度治疗的症状筛选出来,降低了医保的支出,守护老百姓的健康。教育上,针对每个孩子作业的情况,能够针对性地提示知识弱点,做到因材施教,对每个孩子的学习进行用户画像。司法上,科大讯飞与上海高院的专家合作,对刑事类案件审送的流程和机制,训练了司法超脑平台,作为法官助手。

  我们认为,检验AI技术是否真正对数字经济有价值有三个标准衡量。首先是不是有可用的案例,其次是不是能够规模化推广应用的产品,最后有没有可统计的数据来证明应用的成效,即真实可见的实际应用案例、能规模化推广的对应产品以及可用统计数据证明的应用成效。

  新一人工智能技术全球范围内的蓬勃兴起,为经济社会发展注入新的动能,正在深刻改变人们的生产和生活方式。大模型最技术已经成为科技竞争的热点领域,2022年10月7日,美国商务部宣布对华出口芯片管制新规,以英伟达A100GPU为限制标准,对向中国全域出口的GPU及其设计制造技术“限高限宽”,同时加码制裁科大讯飞在内的28家高科技实体公司。核心思想就是要阻断在大模型技术上的关键竞争,面对挑战,建立中国力量和影响力时间紧迫。

  ChatGPT所能实现的人类意图,来自于机器学习、神经网络以及Transformer模型的多种技术模型积累。ChatGPT经过多类技术积累,最终形成针对人类反馈信息学习的大规模预训练语言模型。大模型的智慧能力自进化需要全世界知识和用户反馈喂养,目前从全世界看,ChatGPT已经建立了非常好的正向循环机制,强化了美国科技的全球霸主地位,持续汇聚了全球知识,机器智慧不断涌现扩大。对标GPT4.0,我们从数据质量、算力的储备上,形成的应用场景以及生态和闭环上来讲,都离GPT4.0还有一定的距离,应用生态体系全链路也是一个很大的挑战。目前全球范围内除美国之外,仅中国有望构建形成“新极点”,实现知识汇聚和机器智慧涌现,但时间紧、任务重,科大讯飞正在发挥全国重点实验室的力量,集成高质量数据,加强战略合作,认知全重在开发自己认知大模型的几个关键要素上已有深厚积累。

  往后十年看,现在的时间节点正在迈向从认知智能2.0的阶段,前面1.0基于专家规则、基于数据进行驱动,2.0在数据上进一步实现泛化的能力,认知智能需要在范式和源头技术上实现跨越式突破,目前在各个行业都面临巨大的影响和改变。未来不属于AI,而是属于掌握AI的人类。根据科大讯飞判断,2030年会面临真正通用AI的到来,机器充分掌握世界知识、常识知识,能和人对答如流,具备融合多种知识的自主推理能力,能在交互过程中不断自主进化。认知智能系统达行业人类专家水平,面对行业文本、语音、图像等多模态数据,能自主分析、深入理解、旁征博引、充分决策。

微信
  • 上海国家会计学院
    微信二维码
  • 财政部
    微信二维码
微博