大型语言模型对会计未来发展的影响



** 财会智能化 ** 2024-05-02 21:00

以下文章来源于财务与会计,作者王世杰 刘峰

​**财务与会计 .**​财政部主管、中国财政杂志社主办的综合性财会业务指导刊物——《财务与会计》(刊号CN11-1177/F,邮发代号2-881)官方微信公众号,及时发布刊物信息,开展财会审领域时政宣传、资讯传播、实务交流、理论研究、业务处理、人文分享。

更多精彩推荐,请关注我们

图片

作者简介

王世杰,重庆工商大学副教授,重庆工商大学会计学院财务系主任、智能会计教研室主任。主持国家社科基金等课题6项,参与完成国家社科基金重大、重点项目3项。在《管理世界》《会计研究》等学术期刊发表论文20篇,公开出版专著、教材4部。曾从事会计、技术等实务工作。荣获巴渝学者·青年学者、重庆工商大学优秀教师、教师教学奖等荣誉,兼任重庆市财政局会计咨询专家(试用)、上海国家会计学院智能财务研究院研究员、教育部会计信息化课程虚拟教研室和重庆市成渝数智会计虚拟教研室联络人。

刘峰,厦门大学教授,博士生导师,厦门大学会计发展研究中心主任、《当代会计评论》(CSSCI集刊)主编,财政部会计名家、国际财务报告准则咨询委员会(IFRS咨询委员会)委员。先后在《经济研究》《管理世界》《会计研究》以及Journal of Accounting and Public Policy, Journal of Business Ethics等学术期刊上发表论文70余篇,出版《会计准则研究》《会计准则变迁》《会计学基础》等著作、教材近20部;主持国家自然科学基金重点项目、面上项目、国家社会科学基金项目等课题多项;曾荣获教育部霍英东基金、教育部首届高等院校优秀青年教师奖、国务院政府特殊津贴、全国会计先进工作者、厦门大学葛家澍奖等荣誉。

引用本文请复制此条目: 王世杰,刘峰.大型语言模型对会计未来发展的影响[J]. 财务研究,2023,(4):40-49.

大型语言模型对会计未来发展的影响

王世杰 刘 峰

摘要: 从2022年底开始,大型语言模型成为热议话题,人工智能再次引起全球关注,会计相关职业又一次登上容易被人工智能取代职业的榜单。本文尝试简要总结人工智能的演进和大型语言模型的技术框架,研究其对会计的影响。本文认为:大型语言模型的强大功能源自其巨量数据和大量参数,但具体实现原理目前尚不清楚,通用人工智能尚任重道远。通用大型语言模型本身难以对会计产生直接影响,但人工智能发展将使会计环境和具体对象发生变化,会计工作内容、会计人员能力框架和会计服务市场将被重塑。数智化时代人类经济社会的要素结构、组织形式和权利配置将发生改变,需要重构会计基础理论以适应变化,否则会计可能在经济管理中被削弱甚至消失,会计人员在掌握会计规则的同时,需要熟悉经营管理和技术应用。

关键词: 大型语言模型;人工智能;智能会计;智能财务;GPT

一、引言

大型语言模型(LLM,Large Language Model)^①^ 作为人工智能的前沿技术,因为一款对话产品(ChatGPT)的火爆而破圈进入公众视野,人工智能再次引起全球关注。AIGC(AI Generated Content,人工智能生成内容)和AGI(Artificial General Intelligence,通用人工智能)成为热点话题。截至2023年5月,中国10亿参数规模以上的大模型已发布79个,而2022年到2023年5月全球发布了115个大模型。与2016年AlphaGo(俗称阿尔法狗)引起的人工智能热潮似曾相识,会计相关职业再次登上容易被人工智能替代的职业榜单(Eloundou等,2023)。可喜的是面对大模型热潮,经过财务机器人冲击洗礼的会计人更加从容和冷静。

大型语言模型作为AI前沿技术,不仅改变信息处理方式,也改变信息使用的环境和信息反映的对象。会计从业人员关注大型语言模型,因为它被认为是人工智能领域对财务分析师等职业冲击最大的产品和工具;会计研究人员关注大型语言模型,不仅因为它会冲击会计职业,还因为它将改变会计信息的生成、传播与应用环境,甚至改变会计信息反映的具体对象。

正确看待AI前沿技术大型语言模型对会计未来发展的影响,必须从大型语言模型的底层技术逻辑出发予以解读。本文以ChatGPT的实现技术为例,结合相关公开资料进行分析,抛砖引玉,以期引起会计实务界和学术界的重视。

二、背景介绍

(一)人工智能发展概述

1950年图灵提出“机器能够思考吗”的图灵之问,并提出一种测试方法(即图灵测试),被认为是人工智能研究的起源。1956年夏,麦卡锡等科学家在美国达特茅斯学院开会提出“人工智能”概念。此后40余年人工智能探索道路曲折起伏,机器定理证明、跳棋程序、特定领域专家支持系统等得以成功研发,但更多项目难以推进。20世纪90年代网络技术的发展加快了人工智能研究的进展,深蓝超级计算机战胜国际象棋世界冠军,IBM提出“智慧地球”。早期人工智能研究进展集中在某一特定领域,专注于明确的任务,属于专用人工智能(Special-purpose AI,SAI),自然语言处理属于专用人工智能研究的一个领域。早期自然语言处理主要有两种研究方法:基于规则的符号主义和基于统计概率的经验主义。20世纪90年代末,开发更加通用的人工智能系统呼声越来越高,21世纪初,通用人工智能被提出。随着新一代信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,图像分类、语音识别、人机对弈、无人驾驶等人工智能技术迎来爆发式增长。

进入21世纪,深度神经网络技术被用于自然语言处理,成为主流研究方法。神经网络是对人体神经的模仿,设计若干个计算单元作为神经元形成网络,每个计算单元都是一个特定的函数,都有一个输入值和输出值。计算单元之间的输入值和输出值相互传递,被赋予不同权重,表示计算单元之间影响的大小(冯志伟和丁晓梅,2022)。神经网络有很多个神经元即计算单元相互连接而成,对数据间的复杂关系进行建模。神经网络计算过程中要反复从神经网络的一个层次馈入到另一个层次,穿越多个层次,网络层次具有一定深度,所以基于人工神经网络的机器学习被称为深度学习(Deep Learning),形成的模型被称为深度神经网络模型。

(二)大型语言模型的技术发展概述

2014年,谷歌收购DeepMind公司(AlphaGo即由该公司开发),强化了在人工智能领域的领先优势。2015年,马斯克和阿尔特曼等为了防止谷歌在人工智能领域的垄断,发起成立OpenAI,旨在研究开源的人工智能技术。在某种程度上谷歌和OpenAI均实现了自己的愿景,成为该领域的主要领跑者,推动技术不断迭代进步。表1介绍了AlphaGo出现之后大型语言模型的重要进展​^②^​。

图片

OpenAI与谷歌在大型语言模型上交替开发出优秀的产品,推动了人工智能技术的进步。ChatGPT的出现,正是两家公司相互竞争、相互促进、长期技术积累的结果。

GPT模型是一种采用无标注数据进行训练的模型,通过微调完成特定的监督学习任务。具体来说,它首先采用无监督学习的方式,预训练大量未标注的文本数据,形成一个模型,再利用监督学习的微调,适配具体自然语言处理任务,因而被称为生成式预训练变换器(GPT)模型。此前的神经网络有监督学习模型需要大量标注数据,模型功能无法泛化,而GPT模型数据无需标注,省时省力,模型功能泛化使一个模型通过微调能够完成多重任务,使大型语言模型能够在自然语言处理的不同子领域都有优秀表现,使不同子领域的研究逐渐统一到大模型。

GPT和BERT作为标志性产物经历不断迭代。自2022年11月ChatGPT发布以来,诸多大型语言模型被开发出来。科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,截至2023年5月,中国在2023年发布的大模型就有19个,超过美国的18个,文心一言、通义千问等中国的大型语言模型被发布出来。

三、大型语言模型的技术脉络和现有局限

在大型语言模型出现之前,自然语言处理可以细分为自然语言生成(NLG)和自然语言理解(NLU)两个子领域,每个领域又有不同的研究内容。自然语言处理只是人工智能的一个子领域,此外还有图形处理、语音识别等领域。整体来说,人工智能是一项巨大的科学工程,但技术不断进步使通用人工智能正逐渐成为现实。Transformer模型提出以来,人工智能领域特别是自然语言处理形成了新的研究范式,谷歌和OpenAI分别形成了自身的特色,而ChatGPT的推出使OpenAI暂时处于领先地位。考虑到会计人员对大型语言模型的了解程度,以下研究以ChatGPT为主,但结合研究最新进展进行分析。

(一)大型语言模型的技术脉络

自然语言处理基于统计建模,2017年以前,自然语言处理领域主要基于RNN模型和CNN模型。谷歌2017年发布的Transformer模型依赖注意力机制捕捉输入和输出之间的全局关系,解决了编码步骤中的序列问题,逐渐成为自然语言处理各个子领域的通用模型。谷歌2019年发布的T5模型将不同任务编码为输入的文本指令,使自然语言理解任务的输入和输出形式保持一致,统一了自然语言理解和自然语言生成的任务表达形式,使自然语言处理领域不同任务可以统一建模。这两个模型为后续大型语言模型研究奠定了基础。

谷歌和OpenAI语言模型的技术路线存在一定差异。谷歌的BERT采用双向回归,利用上下文的信息进行预测,更擅长自然语言理解;OpenAI的GPT采用自回归,利用上文预测下文,更擅长自然语言生成。BERT采用微调(Fine-tuning)模式,在专业领域应用需要微调模型参数,而GPT采用零或少示例提示(Zero / Few Shot Prompt)模式,在专业领域应用只需要给予专业数据进行训练,无需调整参数。技术积淀使OpenAI在通用的大型语言模型中暂时领先。

GPT技术路线优势是ChatGPT聊天机器人领先的关键。2020年发布的GPT-3模型通过语境学习(In-context Learning),将预训练语言模型的文本输入作为一种任务说明,以自然语言指示为条件或者给出少量的任务示例,由训练模型预测接下来的文本。GPT-3使用的最大数据集在处理前容量达到了45TB。Language Models are Few-Shot Learner一文阐释了GPT-3的实现原理,GPT-3训练消耗了数千Pfs-day的计算量。GPT-3成本巨大,虽未公开具体成本,但在该论文中提到研究中有个Bug,因为成本原因使重新训练模型成为不可行。“大力出奇迹”,随着算力的增长,在巨量数据反复训练下,GPT-3在问答和文本补全、翻译、常识推理、阅读理解、自然语言推理、综合定性、新闻生成等多个方面涌现出强大的功能(Tom等,2020),而ChatGPT正是在GPT-3的基础上研发出来的。微软研究院对GPT-4进行了测评,认为GPT-4可以解决跨越数学、编码、视觉、医学、法律、心理学等领域的新颖和困难的任务,而不需要任何特别提示,可以被合理地视为通用人工智能系统的早期版本(但仍不完整)(Bubeck等,2023)。GPT-4的模型、训练集和架构并未披露,OpenAI首席执行官阿尔特曼称GPT-4研发的重心在如何提升数据利用效率,诸多专家推测GPT-4延续GPT-3的技术,只是对模型效率进行了优化。

(二)ChatGPT模型的核心技术

GPT-3功能强大,但也存在一些问题。长文的上下连贯、物理常识、数学推理等问题难以完美解决,特别是训练数据集中的文本常常存在错误信息、种族歧视、性别歧视等内容,使模型无法提供用户满意的结果。为了实现3H优化目标(有用的,Helpful;可信的,Honest;无害的,Harmless),OpenAI的一个团队提出利用强化学习方法以对话的形式不断提供反馈使模型知道它何时做得更好、哪些需要改进,而聊天机器人是最理想的场景。

2022年初,该团队开始构建ChatGPT。ChatGPT使用基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来指导模型的训练。训练过程分为三步。

第一步:训练监督策略模型(SFT模型)。GPT-3.5模型^③^难以直接理解人类不同指令之间的不同含义,无法生成高质量结果。因此,首先从数据集中随机抽取问题,由标注人员给出高质量答案,用标注数据微调GPT-3.5模型,得到SFT(Supervised Fine-tuning)模型。SFT模型能够更好遵循指令,但并不一定符合人们偏好。

第二步:训练奖励模型(RM模型)。从数据集里随机抽取问题,使用SFT模型给出多个答案,由标注人员对答案进行综合排序,并使用该排序结果对模型进行训练,得到RM(Reward Modeling)模型。RM模型实现了给高质量的答案赋予更高的分数。

第三步:使用PPO(Proximal Policy Optimization,近端策略优化)强化学习优化策略。从数据集里随机抽取新的问题,使用SFT模型和RM模型分别给出答案,利用奖励函数计算奖励指标,根据奖励指标利用PPO算法优化模型更新模型参数,使模型在新问题上也能给出符合人们偏好的高质量答案。

SFT模型、RM模型并非新的模型,而是ChatGPT模型训练过程的不同阶段。第一步训练使ChatGPT能够更好地理解人类指令,第二步训练使ChatGPT能够给出更符合人类要求的答案,第三步训练则使前两步获得的能力能够泛化,重复训练则强化了这种能力。第二步和第三步可以重复训练,反复迭代训练出更符合3H优化目标的高质量模型。最终使ChatGPT以更接近人类习惯的方式提供答案,并能够模拟多种人类情绪和语气。

(三)大型语言模型的功能与局限

当前不同的大型语言模型侧重有所不同,但主要功能类似,实现原理与ChatGPT相似,并逐渐实现多模态。以GPT系列为例,OpenAI网站显示,开放的GPT模型可以完成知识问答、事实答案、语法更正、提取关键字、生成摘要、摘要注释、论文大纲、创建学习笔记、文本转换为代码、Python代码转化为文本、长文本创建表格、项目分类、电影标题转化为表情符号、计算函数复杂度、编程语言相互翻译、解释代码、代码修复、语言模型辅导、提取联系人信息等42类问题。GPT-3模型的强大功能可以通过API调用,但并未进入公众视野。当ChatGPT以聊天方式呈现这些功能,人们才感受到人工智能生成内容乃至通用人工智能带来的震撼,ChatGPT很快从科技圈出圈,进入媒体和公众视野。

GPT模型的功能来自于模型巨量的训练数据和大量的参数。大型语言模型正是通过大量数据集训练和参数实现各类功能。当数据集足够大、足够丰富,则相应的知识和逻辑等均会被包含在数据集中。在算法和算力的支持下,大型语言模型的训练数据集和参数不断增加,从2017年Transformer模型6 500万参数,到2018年GPT-1模型1.17亿参数,再到2019年GPT-2模型15亿参数,2020年GPT-3模型1 750亿参数,而2021年谷歌Switch Transformer模型甚至有1.6万亿参数。中文中常用“学富五车”“才高八斗”表示人的知识和能力,ChatGPT正是通过巨量数据和大量参数“学富五车”,实现了在多个领域的“才高八斗”。神经网络模型的实际作用机理当前尚不清楚,但几乎一致认为各类知识存储在不同层次的参数里,而复杂推理、遵循指令和功能泛化被认为来自于指令学习和代码训练,当前预训练模型还是一个黑箱,需要进一步研究(Kosinski,2023)。巨量训练数据和模型参数是大型语言模型功能实现的基础,也决定其功能的完备程度。GPT模型的程序语言代码转换和更正功能来自于训练数据集,OpenAI获得微软战略投资,可以使用Github海量的开源代码,训练GPT实现程序语言的相关功能。

ChatGPT等大型语言模型的功能来自于数据集和模型训练,也受制于数据集和模型训练,这是其局限性之所在。ChatGPT训练的数据集截至2021年,此后的事实问题ChatGPT无法回答;对于涉及同一词语不同含义的问题则可能出现错误​^④^​。所以模型并非真正理解人类语言,而是掌握了语言文本的概率分布。不过,涉及政治、种族和性别等存在实体利益冲突的问题,ChatGPT通过基于人类反馈的强化学习能给出符合开发者需要的回答,同时还能拒绝回答不当问题。

四、AIGC、AGI与会计信息处理

(一)AIGC和AGI

AIGC又称为生成式AI(Generative AI)。ChatGPT在内容续写、文学创作、音乐创作、生成代码、注释代码等方面表现得又快又好,具有很强的AIGC功能。生成式AI与决策式/分析式AI(Discriminant/Analytical AI)相对应,是从功能角度对人工智能进行的分类。决策式/分析式AI利用已有数据通过分析做出判断、分析和预测,例如自然语言理解、算法智能推荐、自动驾驶等。生成式AI则是利用已有数据,通过分析进行归纳演绎,形成新的内容,如自然语言生成、文字转图片、文字转代码、代码转文字、文案写作等。此前UGC(用户生产内容)和PGC(专业生产内容)被认为是Web1.0、Web2.0时代网络内容的主要提供者,而ChatGPT等大型语言模型被认为是AIGC的代表,将在Web3.0时代成为内容生产的主要增长点。

AGI与SAI相对应,是从可应用性上对人工智能的分类。当前人工智能领域的突破是在SAI,AGI尚处于起步阶段。SAI面向特定任务,需求明确、应用边界清晰、建模相对简单,人工智能领域前期成就主要集中在SAI领域,AlphaGo属于SAI,自然语言处理、图像识别等也都属于SAI领域。ChatGPT是一个聊天机器人,属于SAI,但展现出强大的通用性功能。与之相比,微软小冰、苹果Siri和智能音响则主要属于自然语言处理专用领域。以微软小冰为例,整体三层构架包括用户体验层、对话引擎层和数据层。用户体验层负责用户输入和小冰响应,主要是自然语言和语音处理;对话引擎层由对话管理器、同理心计算模块、核心聊天、技能四个模块组成,对话管理器中的对话策略会选择相应技能或核心聊天以生成相应响应;数据层则提供对话需要的数据资源(Zhou等,2019)。微软小冰是由不同的专用智能主体(Agent)协同完成与人对话,而ChatGPT作为一个大型语言模型,这些功能均在一个框架下完成,是一个主体。此外,ChatGPT可以将语言转化为颜色,而GPT-4本身即是多模态模型,实现图文信息的统一处理。ChatGPT表现出更强的文本内容生成和代码生成功能,而GPT-4则被认为是通用人工智能系统的早期版本。

必须清晰认识到,虽然ChatGPT等大型语言模型表现出强大的功能,但从技术上说,大型语言模型只是基于巨量文本语料数据集统计分布的生成模型,它和OLS回归类似,能够进行相关性分析,但不具有因果推断能力。通用智能必须能够嵌入现实世界,与人类社会互动,具有“具身学习”能力,这在短期内难以实现(Shanahan,2023)。当前人类对大型语言模型的工作机制并不清楚,知其然不知其所以然,而且现有的不同算法模型只能高效解决特定问题,因此无论是AIGC还是AGI可能仅仅是一个起点,万里长征的第一步。

(二)大型语言模型对会计信息处理的影响

会计的本质是会计学研究永恒的话题,但是无论管理活动论还是信息系统论,会计的基础工作就是会计信息的生成(许金叶,2022)。ChatGPT等大型语言模型作为生成式AI的代表性产品,并非会计专用工具,设计初衷不直接用于会计信息处理。但是,一方面,生成式AI的应用发展将带来经济社会活动、商业模式和组织形式的变化,就如同互联网和数智化一样,会深度嵌入到社会、市场运行中去,同时,也会重塑企业运行模式以及商业模式等,这些都对数智化时代的会计提出调整要求;另一方面,生成式AI也会介入到会计信息处理过程,甚至和云计算、会计机器人等结合起来,会重新定义会计信息处理逻辑。

会计广泛存在于几乎所有的社会组织中,被称为通用商业语言,通过专业方法,对内反映经营管理活动,以期提高经营效率;对外反映受托责任履行情况,以期理清权责关系。对于会计主体,尤其是上市公司,它的会计信息不仅要公开,而且需要遵守既定的规则——企业会计准则,会计信息生成过程流程清晰、规范性高。

会计信息不仅包括财务报表、报表附注,也包括基于财务报表和经营管理数据进行的财务分析结果。单纯从财务报表的角度来看,从企业经营管理原始数据到形成财务报表的整个过程,会计信息自动生成的技术条件早已具备。《企业会计信息化工作规范》第三十二条规定:对于信息系统自动生成、且具有明晰审核规则的会计凭证,可以将审核规则嵌入会计软件,由计算机自动审核。这正是对会计信息自动生成的规范。会计信息之所以暂时无法完全自动生成,主要有两个原因:一是企业管理需要,外部市场变动和内部经营需要会导致管理内容和流程变动,同时会计准则仍然包含了相当程度的判断空间。这些判断空间需要财务人员乃至企业管理人员根据企业具体情况、商业环境等情况进行判断,这是技术难以解决的。二是数据来源限制,供应商、客户、金融机构和税务部门的原始数据,因为制度或管理原因,难以直接与企业会计信息系统无缝对接,虽然API接口和RPA技术一定程度上能够缓解这些问题,但成本高、效率低,影响实现效果。伴随着云计算、物联网、分布式记账等技术的发展和数据流通制度的完善,外部数据限制会逐步减少,而企业经营管理需要将成为会计信息能否自动生成的关键因素。从技术角度,即便ChatGPT没有出现,会计数据核算和财务报表自动生成也能够实现;考虑现实问题,即便ChatGPT已经出现,财务报表自动生成也还没有实现。

目前,ChatGPT等大型语言模型遵循的是自然语言的逻辑,而会计尽管被称为“通用商业语言”,但它并非一般语言,会计语言逻辑也不完全与自然语言一致,大型语言模型在财务报表生成方面并非专长。如果突破管理限制,将企业管理原始数据作为训练数据集,使用大型语言模型生成财务报表是可能的。尤其是在年度报告管理层分析与讨论、财务报表附注等文本信息生成和财务分析领域,大型语言模型具有很大的应用空间。年度报告管理层分析与讨论、财务报表附注等文本信息不像报表数据,已有技术难以做到讨论和附注直接生成,需要人工进行编制。如果将企业经营管理的全部原始数据放进数据集,大型语言模型则可能通过微调后自动生成管理层分析与讨论和财务报表附注。只是当前相对于ChatGPT等大型语言模型开发和维护的巨大成本,中小企业更愿意人工生成管理层分析与讨论和财务报表附注。

广义地看,会计并不限于财务报表的生成过程,财务报表的信息提供、传递、再加工过程、信息使用者的接受与反应等,都是会计的一部分。未来大型语言模型的广泛应用,可能改变会计信息的传递与使用状态,这将对会计理论研究提出新的问题和挑战。现有会计理论研究对会计信息及其相关性的分析,基于财务报表信息直接传递、使用的假设。当大型语言模型广泛应用后,在报表发布和最终使用者之间,将会出现比今天分析师报告更为复杂的信息解读、分析,这对会计信息的生成过程会产生什么样的影响,对会计信息的最终使用产生什么样的影响,都是值得讨论的话题。

五、数智化时代会计的变革与发展

纵观会计发展史,原始社会的狩猎经济使原始会计与文字,以及数学等学科共同起源,人类通过刻画符号和结绳记事进行资源的合理配置,维持部落存续;农业经济时代的簿记方法虽然简单、直接,但能够反映主体之间的借贷、租佃、赋税等关系,为促进经济发展和社会稳定提供了良好的信用工具;资本主义萌芽与复式记账法的出现,推动人类社会经济发展进入一个新的阶段,工业革命带来的社会化大生产使公司成为经济活动重要参与者,从此复式记账逐渐取代了单式簿记,成本管理和管理会计开始出现;资本市场的发展使财务会计成为通用商业语言,形成了当前会计格局。人工智能和数字经济的发展将颠覆现有经济社会模式,推动人类进入数智化时代,必将促进会计范式变革。

以人工智能、大数据为代表的新一代信息技术快速发展,使ChatGPT等大模型得以实现,大型语言模型的AIGC使AGI的实现看到了曙光。大型语言模型对会计的影响不在于对会计信息处理过程的直接影响,而是间接通过改变会计环境和反映对象等影响会计。短期内,大型语言模型会重塑会计业务流程,重构会计人员能力框架;长期看,人工智能将颠覆现有会计范式。在数智化时代,数字经济和人工智能将广泛而深刻地影响经济社会,改变生产要素结构、经济组织形式和权利关系格局,进而颠覆现有经典会计理论和实践,推动新的会计范式出现。

(一)会计信息生成

伴随物联网等技术的成熟和应用,原始业务数据和会计数据以电子数据形式进行存储和处理,会计数据处理过程中凭证、账簿的地位将下降,会计处理流程会被重构。大型语言模型数据处理能力强、响应速度快,在规则明确的情况下,可以直接将业务数据转换为会计数据,未来企业会计人员的重点工作将不再是会计数据生成,而是如何利用会计数据解释和指导业务,为经营管理服务。如果会计数据不能提供比业务数据更多的增量信息,会计在经营管理中的作用将会被不断削弱。

可扩展商业报告语言(XBRL)试图破解数据瓶颈,实现人类商业语言与计算机语言的对话沟通,使计算机能够理解财务报告数据,从诞生以来一直受到全球监管机构和企业的欢迎。但随着大型语言模型的出现,借助大型语言模型即可实现在不同人类语言之间、人类与计算机之间的对话,规范性较强的会计数据可能不再需要XBRL等专用数据标准。

财务报告披露形式,从1844年英国《合股公司法》要求披露招股说明书至今已经近一百八十年,经过资本市场参与者多方反复博弈形成现有格局。大型语言模型数据处理能力的提高有助于实现财务数据的多样化、多维化、多模态,Wallman(1996)提出的彩色报告将成为现实,同样,Sorter(1969)所提出的基于“事项”的会计报告,技术上也不存在障碍。企业可以选择文本、视频、音频等多种形式披露经营情况。伴随模型优化和效率提高,企业将能够以低成本生成披露多样化、多维度、多模态的经营信息,信息披露的成本进一步降低,披露形式更加丰富。随着可持续发展和ESG理念深入人心,若财务报告无法解决数据资源、环境资源和人力资源的计量问题,无法反映数智化时代企业最重要的资源,人类可能借助大型语言模型寻找更高效、全面、准确反映企业经营情况的报告体系,ESG报告等非货币数量报告或将取代财务报告成为公众公司信息披露的第一报告。以货币信息为核心的财务报表信息,在未来信息披露体系中的地位将逐步下降。

应用成本高企、制度建设滞后是制约中小企业直接使用大型语言模型的主要因素。大型语言模型可能会带来会计服务领域的新变化。代理记账企业、财务云服务商等(以下称AaaS服务商)可以借助大型语言模型,探索建立AaaS(Accounting-as-a-Service)模式,为大量中小企业提供全方位、精准型的会计服务。AaaS模式下代理记账企业、财务云服务商等会计服务企业借助大型语言模型建立会计数据生成系统,为中小企业提供会计数据自动生成服务,并从巨量数据中挖掘、发现规律,提供单一企业数据难以捕捉的风险和机会信息,提供融资、投资和市场运作等方面的精准分析,使中小企业从大型语言模型和AaaS中获得更精准的全方位信息和财务服务。与此同时,AaaS模式将重构会计服务市场,少量头部AaaS服务商依托技术和服务占据大部分市场,进一步从数据中挖掘价值,提高服务效率,进而强者愈强,可能超越当前会计师事务所的行业地位,成为最重要的会计服务主体。

数智化时代将重构会计信息生成流程、生成方式、呈现形式和会计服务市场等,当会计规则可以完全嵌入系统,则原始业务数据在规则驱动下能生成会计数据,实现会计信息生成全过程自动化,从而使机器取代人类在当前会计核算中的职能。人类在会计核算中的作用不断前移,只需要将技术与会计规则和企业经营活动结合起来,设计信息生成流程、选择数据模型、开发自动化智能化系统,并将财会监督等内置在系统中,由系统自动完成会计核算,传统的会计核算将消失。会计信息生成自动化能够提高会计信息的准确性和及时性,但需要对模型和系统进行监督,通过会计规则予以规范,以避免舞弊造假事件。同时,通过原始业务信息输入影响大型语言模型可能会成为一种新的恶意攻击手段,因此使用大型语言模型生成信息时,对数据和模型的监管格外重要。

(二)会计信息传播和应用

大型语言模型将使数据收集、处理和分析变得高效,企业数据只要公开披露即可快速、高效展开纵向、横向比较分析,实现企业经营数据处理和分析的自动化、智能化、实时化。ChatGPT能够根据训练数据计算相应财务指标,并对指标进行详细解读和分析,降低了企业财务数据分析和应用的门槛,使财务信息的受众更广、影响更大。财务等信息的快速生成、高速传播,将使资本市场更加有效,资本全球化趋势不可逆转。

快速、高效的大型语言模型将为市场监管带来便利。在资本市场上,监管机构对财务信息进行监管,并要求上市主体提供财务等信息,进行信息披露。借助大型语言模型的微调机制,监管机构可以将大量的上市主体披露数据作为数据集,训练财务信息专用模型,用于财务信息质量评价,并借助审计和监管的反馈数据,对模型不断训练,提高评价和监管准确度。值得注意的是,在尚未真正实现智能化之前,监管机构已有数据的可靠性将影响财务信息专用模型的功能,上市主体针对模型反馈对财务信息不断修正也将影响模型的实际效果。监管机构要对训练数据进行甄别,并对模型使用进行合理控制,以避免专用大型语言模型与上市主体之间的零和博弈​^⑤^​。

在人工智能的帮助下财务数据分析和解读更加便利,但也可能存在偏差,若不具备会计基础知识或不了解企业经营基本情况,使用者可能作出错误判断,这时便利性则会带来更大的负面影响。会计信息生成、传播和应用的自动化和智能化程度,取决于技术、成本和法律。随着技术发展,大型语言模型等智能工具的成本将不断降低,但终究存在使用门槛,一部分人可能无法使用相应的技术,产生“技术鸿沟”,进而导致市场割裂和不公平竞争。因此需要建立与之相适应的会计规则和法律法规,解决大型语言模型等人工智能带来新的伦理和法律问题,保障大型语言模型被公平合理地应用。

(三)会计基础理论

数智化时代,会计信息生成、传播和应用将颠覆现有范式,从而也将从根本上对成型于工业经济时代的现有会计理论提出挑战,呼唤与数智化时代相适应的会计基础理论的重构,如果基础理论无法突破,现有会计可能固步自封,被历史抛弃。

——会计的性质。这是会计最基础的理论话题之一。早期对会计性质的研究,倾向于从管理活动或信息系统来讨论;在实证会计兴起后,学术界对会计的讨论主要是从受托责任观和决策有用性来展开;刘峰(2015)则从信任角度讨论会计的性质。数智化环境下,传统意义上以报告财产变化为核心内容的会计信息,在社会信息体系中的地位是下降、上升,还是发生其他性质上的改变,这是未来学术研究中需要回答的核心问题。这在一定意义上也决定了未来会计学科的走向。

——会计的确认计量。大型语言模型需要巨量数据、强大算力和算法。2019年,OpenAI获得微软战略投资,部分投资以云计算平台Azure的使用额度为形式支付,从而使OpenAI获得了算力支持。ChatGPT同时还获得了GitHub海量开源代码数据,为其程序语言代码转换和更正功能奠定了基础。2019年,OpenAI从非营利组织调整为“有限营利”组织,与微软合作,是应对新技术发展的高成本投入和收益高度不确定下的组织形式和商业模式创新。数智化时代,数据、算力和算法将成为一种数字经济的基础设施,也将会出现专业的社会经济组织,提供这些公共基础设施。数据、算力和算法等经济要素的确权、定价、流通问题将是数智化时代经济社会的基础问题,而数据、算力和算法有别于土地和资本,如何进行核算将会对传统会计确认计量理论提出重大挑战,需要突破会计计量模式。数据资产本质特征的认定、数智化时代商业模式与收入确认、数据资产的计量等问题都亟待解决。

——信息披露方式。现有的财务报告体系以资产负债表、利润表和现金流量表为核心,其中,现金流量表产生于上世纪80年代末,就是因为社会经济环境变化、现金对企业的重要性增加所致。大型语言模型深度嵌入人类社会的各个环节,其改变的不仅仅是信息的生成和传递,也必将会像2007年iPhone的应用重构商业运行一样,对商业活动、人们的行为产生革命性影响。相应地,现有报表体系、资产负债表和利润表的结构等,都将面临来自大型语言模型所带来的社会环境的冲击,无论是基于“事项法”的报告体系,还是“彩色财务报告”,也包括目前重视文本描述的ESG报告等,都与货币计价为基础的单一财务报告有很大不同。

此外,数智化和大型语言模型还为其他相关会计理论研究提供了新的研究场景。以会计信息有用性的研究为例,现有的基于“大智移云物区”的会计审计机器人,总体仍然是基于传统的会计信息生成和传递逻辑来设计的,即:假定财务报告是基于具体会计准则、根据相应的会计循环程序完成财务报告的生成,并提供给信息使用者。大型语言模型不仅会改变会计信息生成过程,还在会计信息提供与信息使用者的最终使用之间增加了环节,这改变了会计信息传递的过程,其对会计信息及其有用性会产生什么样的影响,同样值得学术界进一步研究。

(四)会计和会计人的未来

会计伴随人类的产生发展而产生发展,长期以来在人类解决生产效率提高、财富合理分配等问题上,发挥着不可替代的作用。当前会计作为通用商业语言,是人类经济社会解决信任、信用问题的有效工具。人类发展的历史始终着眼于生产效率提高、财富合理分配、风险管理等问题,通用商业语言和信息披露机制是人类目前找到的解决信任问题、提高生产效率、合理分配财富和降低风险水平的应对方案。技术进步可能颠覆经济社会发展的传统趋势,但人类始终需要能够解决信任和信用问题的工具。因此会计等工具,将伴随人类历史始终,但未来会计是否脱胎于当前会计,当前会计的理论和方法未来能留存多少,都需要会计人不断顺应时势,根据经济社会环境、生产要素特征、经济组织形式等进行创新。如果会计理论发展不能紧跟形势,作为通用商业语言的地位有可能被ESG报告等新的信息披露方式所取代。

伴随大数据和人工智能技术发展,利用技术将会计规则嵌入系统,由业务数据直接生成会计数据,需要专业人员同时掌握会计规则和技术模型。会计人员挖掘会计数据和业务数据为经营决策服务,需要掌握相应的数据分析和处理技术。数智化时代合格的会计人员不仅要了解会计规则,也要熟悉企业经营管理,还要掌握必要的信息技术,真正实现业、财、技融合。传统会计核算岗位将退出历史舞台,被掌握会计规则和信息技术的模型设计开发人员取代。传统会计分析岗位将被重塑,现有财务分析指标规范,对于训练数据集中存在海量数据的公司,大型语言模型能够直接提供相应的财务指标分析结果,也能够对相应的财务指标给出相应的解释。会计分析岗位的重点工作将从现有内部财务数据分析,转向内外部、宏微观、业财数据的一体化分析,实时监测风险和机会,为经营决策服务。会计人员需要因势而变,了解、学习和掌握必要的信息技术。会计人员必须成为掌握会计规则、熟悉企业经营、了解前沿技术应用的复合型人才,单纯掌握会计知识的人员将逐渐被复合型人才开发的模型、算法所取代。会计工作岗位和人员将会减少,会计人员的能力和素质要求将会提高。

在基础岗位面临被替代的同时,一些新的岗位也会随之诞生。GPT的生成能力固然强大,但如何让模型生成符合预期的信息和报告,则需要以专业的方式去引导。事实上这样的岗位已经存在了:提示工程师(Prompt Engineer)——负责通过优化提示(Prompt)来提高大型语言模型返回结果准确性的工程师。在会计的应用场景下,如何更精确、高效地引导大型语言模型生成所需要的报告,同时对大型语言模型提供的信息进行甄别,这些都要求与大型语言模型对话的人员具备一定的专业会计知识。AIGC的发展势必会带来更多的衍生职业。

六、结束语

随着人工智能技术的快速发展,如何准确而又清晰地让会计人员了解、理解、掌握、应用必要的人工智能技术,是一个亟需解决而又难以把握的问题,本文未尝不是一种探索,在大量媒体报道和专业文献中尝试准确清晰地向会计同仁介绍技术的发展和影响。未来人工智能领域竞争的加剧,将给人类社会带来更大的冲击。真正实现通用智能,进入数智化时代虽呼之欲出,但必然不是一蹴而就。会计人当前还能相对从容地紧跟技术进步、深入鲜活实践,探索理论创新,以应对数智化时代的到来。如果会计人不能了解和掌握智能技术的一般原理、方法,无法创新会计理论,会计被其他信息披露手段所取代也未尝没有可能。因此会计人员需要以开放的姿态,拥抱新技术、新经济,深入实践一线,发现规律,创新理论。这一过程中,会计人员应该掌握哪些智能技术、掌握到什么程度,如何正确理解智能发展,使用智能提高会计效率,都是值得深思的问题。

图片

注释:

①大型语言模型又被称为大语言模型、大模型,本文论述中以大型语言模型为主,部分使用大模型。当前大模型并无统一定义,主要以参数数量界定大模型。

② 在此期间,还有其他的大型语言模型发布,谷歌和OpenAI的系列典型模型,在发布之时均具有创新性,并影响其他模型的研究,更具代表性,因此选择这些模型进行列示。早期的语言模型相对现在的模型难以称得上大模型,但在当时已经是突破性的大模型。

③OpenAI在发布GPT-3之后,模型进行了一系列迭代,OpenAI称这些模型为GPT-3.5,但这些模型并未正式公开。业界一般认为ChatGPT是在GPT-3.5基础上训练的,而非直接使用GPT-3。

④见https://3w.huanqiu.com/a/c36dc8/4BeewUeHXA5中的案例。

⑤专用大型语言模型根据上市主体提供的财务数据进行训练并反馈,而上市主体也可以根据模型反馈和评价对财务数据进行管理,进而在使用过程中不断博弈。如果博弈过程失控,可能导致零和博弈。

图片

主要参考文献:

[1]冯志伟,丁晓梅.自然语言处理中的神经网络模型[J].当代外语研究,2022,(4):98-110.

[2]刘峰.会计 · 信任 · 文明[J].会计研究,2015,(11):3-10.

[3]许金叶.智能会计理论基础:“会计信息系统论”的发展——纪念余绪缨教授诞辰100周年[J].财务研究,2022,(1):38-48.

[4]Bubeck, S., Chandrasekaran, V., Eldan, R., et al. Sparks of Artificial General Intelligence: Early Experiments with GPT-4[EB/OL].(2023-04-13). https://arxiv.org/abs/2303.12712.

[5]Eloundou, T., Manning, S., Mishkin, P., et al. GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models [EB/OL]. (2023-03-23). https://arxiv.org/abs/2303.10130.

[6]Kosinski, M. Theory of Mind May Have Spontaneously Emerged in Large Language Models[EB/OL].(2023-02-10). https://doi.org/10.48550/arXiv.2302.02083.

[7]Shanahan, M. Talking about Large Language Models[EB/OL].(2023-02-16). https://arxiv.org/abs/2212.03551.

[8]Sorter, G.H. An“Events”Approach to Basic Accounting Theory[J].The Accounting Review, 1969,44(1):12-19.

[9]Wallman, S.M.H. The Future of Accounting and Financial Reporting(II): The Colorized Approach[J].Accounting Horizons,1996,(6): 138-148.

[10]Zhou, L., Gao, J., Li, D., et al.The Design and Implementation of XiaoIce, an Empathetic Social Chatbot[EB/OL]. (2019-09-14). https://arxiv.org/abs/1812.08989.

基金项目

国家自然科学基金重点项目(72232007);国家社会科学基金一般项目(21BGL185)

来源:《财务研究》2023年第4期