AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


胡开宝 I 大语言模型背景下的外语学科发展:问题与前景
发布日期:2024-08-16 12:13:36 浏览次数: 1664


1. 引言 



作为人工智能领域的新兴技术,大语言模型能够理解和生成文本,完成翻译、写作、问答等任务,在人们学习、工作和生活中拥有广阔的应用前景。大语言模型在外语学科中的应用不仅能够引发外语教学革新,推动数据驱动、以学习者为中心的发现式和探索式教学模式构建,而且能够促进学术研究方法创新,拓展并深化外语学术研究。这一现实语境下,外语学科应何去何从?如何发挥大语言模型的优势以趋利避害实现新的发展?为回应类似关切,本文将在梳理大语言模型概念与特征的基础之上,分析大语言模型背景下外语学科发展面临的问题,并探讨外语学科未来的发展前景。



2. 大语言模型的界定和特征 



2.1 大语言模型的界定  


大语言模型是指基于大量数据集训练,能够生成类似人类文本的扩展型人工智能系统(Bender et al. 2021)。陈慧敏等(2024)指出,大语言模型是基于大规模无标注数据自监督学习,具有较强通用能力,能够适应和完成多场景任务的大规模预训练语言模型。大语言模型是基于深度学习,利用神经网络和海量文本数据训练机器学习人类语言的词汇、句法、语义、语篇等方面知识和规则而形成的模型。 
 
大语言模型的构建主要分为建立模型和训练模型两个阶段。研发人员先是构建一个初始的神经网络,根据输入的文本数据进行词向量编码和网络层与层之间的计算,不断调整神经网络参数,构建表征语言模型的神经网络。然后,研发人员利用海量语言数据对模型进行训练,并更新神经网络参数,提高其文本处理的质量和效果。

2.2 大语言模型的特征 


大语言模型主要具有参数规模大、理解能力强、适应性强、应用范围广等特征。其一,大语言模型包含数十亿乃至数万亿参数。这些参数使得大语言模型能够学习人类语言应用的规则与规律,甚至捕捉语言的细微差别和复杂性,并能像人类一般理解和应用自然语言。其二,大语言模型可基于大量文本数据的分析,理解与生成符合语言规则和具体语境的文本,表现出较强的语言文本深层意义理解能力。其三,大语言模型训练使用的文本数据虽是通用文本数据,但通过微调可适用于医疗、法律等特定领域的语言处理任务。其四,大语言模型可应用于各种形式或各种模态的文本生成,以及翻译、问答、情感分析等其他自然语言处理任务。具体而言,大语言模型能够撰写文章,回答用户提出的问题,承担翻译任务,也能创作图画和视频,挖掘和提取文本数据,还能进行语料分词和标注、命名实体识别和文本分类等技术处理。


3. 大语言模型背景下外语学科的发展问题 


 
大语言模型的应用已经逐渐引发高等教育领域的关注和探讨,技术升级和规模增长将不断拓展大语言模型的应用范围和服务方式。大语言模型也对包括外语学科在内的各个学科带来前所未有的挑战,不仅放大了外语学科本身固有的问题,而且促发了一些未曾预想的学科发展新问题。

3.1 外语专业人才需求降低  


大语言模型能够理解人类语言,应用人类语言进行写作和翻译,分析文章主题,识别文章情感。因而,利用大语言模型,我们可以根据要求写出通顺地道、符合目的语语言规范的文章,与他国人民交流信息和观点,讲述中国故事,传播中国文化。大语言模型有助于将外文文献译成汉语,了解国外经济社会发展和科技前沿动态。事实上,大语言模型翻译的质量相当高,而且速度远快于人工翻译。近年来,随着机器翻译系统的应用,翻译公司大幅减少翻译专业毕业生的招聘数量,大语言模型则会助推这一趋势的发展。大语言模型将在较大程度上削弱外语专业人才现有的外语技能优势,降低社会对外语专业人才的需求。  

长期以来,学界过于强调外语学科的工具性,而忽略外语学科的人文性和科学性。工具性指掌握一门外语对于个人沟通与交流、职业发展等方面的基础性和服务性功能。人文性指学习、掌握外语过程中领会和体悟外语蕴含的文化与历史、价值观、思维方式等人文思想和精神。人文思想主要是指人文观念、个人观念和自由观念;人文精神实际上是对生命价值、人的生存意义和人类未来意义的理性关注。科学性指用科学思想、科学方法和科学精神探究语言教育与语言本体的内在规律,通过对语言现象的逻辑分析、理论建构和实证研究,理解和掌握语言作为人类沟通工具的本质和功能。当前高校外语专业普遍注重外语技能培养,专业课程中技能课程所占比重相当大。虽然外语专业的一些课程与人文教育有关,但这些课程通常只是外语学科人文性的点缀,难以构成有机的人文教育体系。再者,外语学科的科学性尚未得到应有关注,技术和科学方法在外语学科研究中的应用仍受质疑,外语专业课程体系中技术或科学方法课程相当少见。应当指出,外语学科一方面与人类的精神生活、精神世界密切相关,富含人文思想和人文精神,另一方面又与科学方法、科学精神密不可分,语言学研究也呈现出愈加显著的与数据科学、脑科学等自然科学交叉融合的趋势。外语学科的人文性和科学性紧密相连、缺一不可。大语言模型背景下,如果一味强调外语学科的工具性而忽视人文性和科学性,外语学科核心竞争力必将不断被削弱,导致外语专业人才的社会需求进一步缩减。

3.2 教师知识传授者角色受到削弱


师者,释疑解惑也。古往今来,教师一直在知识传授中发挥主体作用,教师向学生传授各种知识,并通过作业、考试等方式考查和评估学生对所学知识的掌握程度。然而,大语言模型背景下,人不再是知识的唯一主体,越来越多的知识由人机共同生成。大语言模型通过海量文本数据的训练能够学习掌握常识性知识和百科知识,重新组合现有知识,回答用户提出的问题,从而削弱教师作为知识传授者的主体作用。  

多年来,外语教师主要侧重于外国语言文化知识传授,担任现有知识的“搬运工”。但是,信息技术时代很多知识可以通过互联网搜索引擎查询或向大语言模型提问等方式获取,教师掌握知识的广度和深度又不及大语言模型,致使外语课堂教学内容的学术性和创新性不足,未能充分激发学生的学习兴趣和动机。不过,尽管大语言模型可以回答关于外语学习、外国语言文化等方面的问题,能够提供相关知识,但这些知识是大语言模型利用已有训练数据产出的信息,本质上是对现有知识的组合运用,而非新知识。毕竟,新知识的生成涉及原创性思考和批判性思维,这些超出了大语言模型的能力范畴。由此,大语言模型背景下,外语教师知识传授者的角色受到削弱,需要拓展知识生产者、创新者等其他角色与身份。

3.3 外语专业设置难以对接大语言模型技术发展  


我国外语专业设置主要历经通识型外语专业和复合型外语专业两个发展阶段:前者旨在培养外语综合应用能力突出、外国语言文学知识扎实的外语专业人才,后者侧重于培养兼具外语综合应用能力、一门专业知识和技能的外语专业人才。这些专业均很好地满足了社会不同发展时期对通识型和复合型外语专业人才的需求。然而,随着大语言模型技术的应用增加,外语专业日渐表现出与信息技术时代发展需求相脱节的缺陷。 
 
实际上,大语言模型研发离不开外语学科的支撑。一方面,作为外语学科重要组成部分,语言学为大语言模型研发提供自然语言理解框架,为语言数据标注、模型构建和错误识别提供理论支撑。语言学分析能够厘清大语言模型研发所需依循的语言规则,探寻语言的异同和发展规律。语言生成及其质量评估也需运用语言学理论。另一方面,大语言模型的语言数据训练及与其相关的自然语言处理同样依赖语言学知识。大语言模型的研发需对训练数据进行句法、语义、语用等层面标注的技术处理,需运用句法学、语义学、语用学等领域的语言学知识。作为大语言模型重要基础的语料库建设离不开语料库语言学专家的支持,多语种语料库建设更是需要外语专业人才的介入。然而,外语专业设置尚未对接大语言模型技术的快速发展,外语学科在大语言模型技术研发和应用领域未能充分发挥作用。

3.4 语言数据重要性未能得到充分认识  


语言数据是指与语言应用相关的数据,包括书面文本、图像、音频和视频等。人工智能时代,语言数据的价值逐渐得到学界认同。人工智能技术涉及算力、算法、数据、场景等四大要素,其中包括语言数据在内的数据是重要物质基础。数据挖掘技术有助于从海量语言数据中提取有价值的信息,分析事物发生发展规律,开展相关领域的理论研究和应用研究。具体而言,企业可利用语言数据获取客户反馈,改善客户体验,研发新产品和新服务。政府机构可通过分析社交媒体的语言数据来了解民众的需求和期望。2022年,中共中央、国务院发布《关于构建数据基础制度,更好发挥数据要素作用的意见》,明确将数据列为生产要素。大语言模型技术的研发更是凸显了语言数据的重要性。海量语言数据收集是成功研发大语言模型的前提条件,语言数据质量直接决定大语言模型性能。

然而,语言数据对外语学科发展的重要性迄今没有得到充分认识。语料库技术可使研究者在分析大量语言数据的基础上开展语料库语言学、语料库翻译学、语料库文学等领域研究,避免研究的主观性和片面性。语料库语言学和语料库翻译学研究已经取得一定发展,但尚未引发应有关注,研究队伍人数相比外语学科其他领域少得多。尽管有学者倡导开展基于语料库的文学研究(胡开宝,杨枫 2019),语料库文学研究几乎未有进展。


4. 大语言模型背景下外语学科的发展前景 



鉴于大语言模型背景下外语学科面临的问题,未来学界应实现外语学科与大语言模型发展充分对接,从以下方面着手推动外语学科的可持续发展。


4.1 推进外语专业教育信息化转型


近年来,教育部一直在倡导推进教育信息化战略实施。2018年,教育部发布《教育信息化2.0行动计划》,提出教育信息化是指利用包括计算机、互联网和智能设备在内的现代信息技术改进和优化教育教学方法、管理模式和学习方式,以提高教育效率和教育质量,促进公平教育,推进教育的现代化。教育信息化的核心是教学信息化,主要包括教学手段的信息化和教学评价的信息化。外语专业应重视语言数据在外语教学中的应用,采用语料库技术、数据挖掘技术和大语言模型技术推进教育信息化。

首先,在语言数据处理的基础上,研发智能化外语教学平台。这类平台可自动呈现教学内容,并提供相关数据支撑,将教学内容的讲解与以图表形式呈现的数据分析有机结合起来,从而实现外语课堂教学的数据化和可视化。其次,建设并使用收录教师课堂教学话语及教学行为的多模态语料库,分析课堂教学话语、教学行为与课堂教学效果之间的相关性,研制课堂教学质量智能评测系统。再次,利用语言数据,开发具有智能化、个性化和互动式等特征的数字化教材。智能化指教材能够自动呈现课文内容,自动生成相关教学数据。个性化是指教材设计允许学生根据自己的外语基础、所学专业及学习兴趣,选择相应主题和难度的文章,并自动组编教材课文和练习。互动式是指学生可直接提交问题和练习答案,教材及时反馈,并根据学生的学习需求自动推送相关文献资料或微课视频等。最后,发挥大语言模型在分析文本、回答问题、批改作文和翻译作业、编制练习和试题等方面的技术优势,推进外语教学工作的信息化和智能化。

4.2 形成外语专业、课程设置与大语言模型发展的对接 


外语专业应从新课程开设、新专业建设等方面进行专业改造,以对接大语言模型技术的发展。其一,重视学生科学精神和科学素养培养,倡导科学方法和技术在外语学科教学与研究中的应用,在现有专业课程的基础上增设与大语言模型技术相关的课程,如高等数学、统计学、数据科学、语料库建设与应用、句法学、大语言模型基础及自然语言处理等,使学生了解大语言模型的基本原理、研发技术和主要功能,掌握语料库建设与应用的理论和方法。其二,增设机器翻译、译后编辑等课程,讲授机器翻译的基本原理、译后编辑的流程和方法,组织学生参与机器翻译系统研发,开展机器翻译质量评估。其三,开设语言数据科学与应用、语言智能等外语学科与数据科学或人工智能融合的文理交叉专业,培养一大批既掌握数据科学相关知识又精通语言学的语言数据处理与应用人才。语言数据科学与应用专业以语料库和数据库建设与应用为核心,采用数据科学方法,对语言学、翻译学、语言智能等领域的重要问题开展研究,开发语料库、数据库及语言智能产品。近年来,国内已有高校先后开设了与大语言模型相关的外语专业,比如上海外国语大学的语言数据科学与应用专业、西安交通大学的语言数据科学专业、湖南大学的语言智能专业、青岛大学和浙江财经大学的“语言+大数据”专业等,以对接大语言模型技术发展。

4.3 推动大语言模型在外语教学中的应用  


自大语言模型问世以来,学界开始关注大语言模型在不同领域的应用,涉及翻译研究(胡开宝,李晓倩 2023)、出版(徐敬宏,张如坤 2024)、司法与检察(蔡鹏程 2024)、文博(赵婧等 2024)等领域。已有学者从个案分析角度探讨了大语言模型在外语教学中的应用(陈舒梦 2023;许家金,赵冲 2024)。但是,学界仍有必要从大语言模型的特征和功能出发,系统分析大语言模型在外语教学中应用的原则、路径和主要方向。

大语言模型能够翻译文章,修改并润色文章,还能根据要求撰写摘要,编制练习,回答学生提出的各类问题,故而可以直接应用于外语教学,并带来外语教学主体、模式和方法的变化。其一,大语言模型在外语教学中的应用会导致教师和学生角色发生变化。大语言模型可以扮演知识传授者角色,回答学生提出的涉及不同领域的问题,为学生释疑解惑。显然,教师不能也不应满足于知识传授者角色,还应充当导师、学生学习伙伴等角色。相应地,学生不再是被动的知识接收者,而是积极的知识建构者。其二,借助大语言模型的技术优势,外语教学内容的讲解和分析可建立在对语言数据考察和定量分析的基础之上,实现外语教学的数据化和可视化,为构建数据驱动式教学模式提供重要物质基础。教师还可组织学生运用大语言模型分析具体文章的主题、语言特征、写作方法及作者的观点和情感,让学生在自主探索、自主发现过程中掌握外国语言文化知识,培养专业技能。数据驱动式教学模式或发现式教学模式构建较为复杂,需要具体分析大语言模型的特征和功能、教师和学生的角色定位、大语言模型在教学中应用的步骤和方法,实现大语言模型和外语教学的有机结合。

有必要指出,大语言模型在外语教学中的应用可能会产生准确性、依赖性、学术诚信、数据偏见和技术门槛等方面的问题。准确性问题指大语言模型有时会产生错误或误导信息。Chomsky et al. (2023) 已经指出,ChatGPT及其同类系统在平衡创造与限制方面存在天然缺陷:一是过度生成,既产生真实信息也产生虚假信息,既支持道德的决策也支持不道德的决策;二是生成不足,对决策不做承诺,对后果漠不关心。依赖性问题指学生往往会过于依赖大语言模型,致使其学习动机、学习能动性受到抑制,影响知识和技能水平提升。学术诚信问题指利用大语言模型完成作业或撰写文章过程中的抄袭、剽窃等学术不端问题。数据偏见问题指大语言模型训练使用的数据可能存在意识形态或偏见问题。技术门槛则指不是所有教师或学生都能使用大语言模型,导致教育资源或技术应用的不平等。为此,大语言模型在外语教学中的应用研究须深入分析上述问题及潜在的教育风险,探讨解决问题和规避风险的方法与举措。

4.4 重视大语言模型在外语学术研究中的应用  


大语言模型具有很强的文本分析能力,能够分析文章的主题、特征和情感,可应用于以文本分析为基础的语言学研究、翻译研究、文学研究等外语学科专业研究及相关人文社会科学研究领域。关于大语言模型在翻译研究中的应用,胡开宝和李晓倩(2023) 已做了较为细致的梳理,认为翻译研究者不仅可以探讨如何利用大语言模型技术开展翻译研究,而且可以分析大语言模型在翻译实践中的应用所产生的翻译伦理、译者主体性、译者风格及译作意识形态等问题。该研究只是从理论层面探讨了大语言模型在翻译研究中应用的主要领域和具体路径,但是相关实证研究阙如。大语言模型在语言学研究和文学研究中的应用探讨目前仍然鲜见,亟待开展。

大语言模型在语言学研究中的应用主要包括理论语言学和应用语言学研究。研究者可利用大语言模型技术,分析词汇构成、句子结构、词语和句子的意义构成,揭示特定语法现象的分布、变化及语言演变过程,评估学生的语言能力,探讨具体社会群体、社区或文化语言应用的趋势和规律,考察不同种类话语的语体特征、话语规范、话语策略以及话语与意识形态的互动关系。大语言模型在文学研究中的应用主要涵盖文学作品研究、作家研究等方向。研究者可发挥大语言模型的技术优势,分析文学作品的文体特征、主题和意义、人物形象以及文学作品的传播和接受。研究者还可利用大语言模型分析作家风格、作家创作技巧、作家写作手法的特征及其演变,探讨文学作品的叙事视角、叙事结构和情感极性。大语言模型在语言学研究和文学研究中的应用不仅能够丰富研究方法,而且能在很大程度上深化研究内涵,拓展研究领域。


5. 结语 



本文在梳理大语言模型的界定和特征的基础之上,结合外语学科专业现状分析了大语言模型技术应用带给外语学科发展的问题,并围绕问题探讨外语学科发展的前景。大语言模型技术发展使外语学科面临专业人才需求降低、教师角色身份转变、专业设置滞后等方面问题。为应对和解决这些问题,外语学科未来应当推进外语专业教育的信息化,形成外语专业设置、课程设置与大语言模型发展的对接,推动大语言模型在外语教学中的应用,重视大语言模型在外语学术研究中的应用,促进外语学科的可持续和高质量发展。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询