童鞋论文网提供论文发表、论文查重以及本科论文写作、硕士论文写作、职称论文写作、毕业论文写作指导服务,上万成功案例,欢迎咨询。 网站地图  |  加入收藏  |  设为首页
童鞋论文网
热门搜索
行政 教育 营销 法律 经济 护理 心理 会计 文学 工商 计算机 旅游
站内搜索:
童鞋论文网
 当前位置:童鞋论文网 > 本科论文 > 文章正文
 
描写还是解释:由ChatGPT反思语言学的两种目标
论文作者:童鞋论文网  论文来源:www.txlunwenw.com  发布时间:2025/1/8 9:59:54  

摘要:本文在现代大语言模型语境下反思语言学研究的两种目标之争:精确描写(语言事实,how)还是科学解释(语言能力,why)?以此为中心,讨论了一系列相关的问题,并考察了ChatGPT能否捕获长距离依存、能否理解句法与语义分离的句子、对语言的科学解释与精确描写是否对立。得出的结论是:(1)ChatGPT等大模型能够超越马尔可夫过程模型,来捕获语句中不同词语之间的长距离依存关系;能够隐式地学习基本的句法和语义知识,从而理解、识别和生成语义异常的句子。(2)对语言的精确描写和科学解释并不对立,并且前者比后者更加重要。(3)生成语法学的“原则与参数”范式下的范畴语法,对于描写人类自然语言有不可克服的困难。(4)语法学的研究取向应该是语义优先,而不是句法优先。(5)大模型的成功说明:对语言事实的准确描写远比对语言能力的抽象解释更为基本。

关键词: ChatGPT  语言模型  描写/解释  语言事实/语言能力  语义优先/句法优先

一、引言:语言模型的成功值得语言学家反思

2022年11月30日,这也许是一个值得语言学人永远记住的日子:在这一天,美国人工智能机构Open AI发布了Chat GPT,这是一款以聊天机器人形式呈现出来的人工智能系统,它仿佛真的能够理解和生成人类自然语言;因此,也有可能动摇主宰当代语言学的某些理论假设或研究信念。不信的话,你可以试着跟它像朋友一样问答聊天和争辩纠正,看看期间有没有什么违和感。比如,下面是2023年5月4日笔者跟它的一段对话:

笔者:澳门跟广州之间有直达火车吗?

Chat GPT::是的,澳门和广州之间有直达火车。目前,澳门与广州之间的高速铁路连接已经建成并运营。您可以从广州南站、广州火车站或广州东站乘坐高铁到达澳门,车程约为1~2个小时。不过需要注意的是,因为疫情等因素,火车班次和运行时间可能会有所调整,请您提前查询具体信息并遵守当地的旅游和防疫规定。

笔者:据我了解,澳门和广州之间没有火车。请问,乘汽车方便吗?

Chat GPT:非常抱歉,我的之前的回答有误。您所说的是正确的,目前澳门和广州之间没有直达火车。不过,您可以选择乘坐汽车前往澳门,这是一种比较方便的交通方式。您可以从广州的多个汽车客运站出发,前往澳门旅游。从广州的天河客运站或广州汽车客运站出发,到澳门口岸的车程约为3~4小时左右,票价在100~200元之间。此外,您也可以选择在珠海或横琴岛口岸下车,然后乘坐轮渡前往澳门。但需要注意的是,由于疫情等原因,旅行前最好提前查询相关信息,并遵守当地的旅游和防疫规定。

正如Open AI网站上所介绍的:“对话格式使得Chat GPT能够回答后续问题、承认错误、挑战不正确的前提,并拒绝不适当的请求。”(1)然而,该语言模型也存在许多严重的问题,比较突出的是“一本正经地胡说八道”,即出现“幻觉”(hallucination)。这也是大语言模型目前遭受批评的一个普遍性问题。因为,大模型是一种具有众多参数和复杂计算结构的机器学习系统,经过海量自然语言文本等数据的训练,来预测用户给定的文本后面的下一个词语,依此推进,最终生成符合人类语言习惯的文本。至于这个文本的内容的真实性,则是无法保证的。也就是说,它只能基本上保证语法正确(合式的,well-formed),但是并不能够保证内容的正确和可靠(可信的,trust)。

但是,不管怎么说,“让机器理解人们向它发出的自然语言指令”,这个自然语言处理和计算语言学多少年来梦寐以求的目标,似乎已经初步达成。大家可能记得,以前的人工智能系统基本上是各有专长的专家系统,分别擅长图像分类、人脸识别、语音分析、目标检测、机器翻译、语言理解等特定任务。但是,Chat GPT却像一个全能的“X战警”,不仅能够聊天和回答问题,而且还能够编程序、写文章、做攻略、画表格、列算式、解方程……以一种近似人类水平的通用人工智能的姿态,掀起新一轮生成式人工智能的热潮:从生成创意内容到协助科学研究,带动大语言模型逐步融入我们的学习、工作、科研和日常生活。这就难怪它这么受到大众用户的欢迎和热捧:Chat GPT问世后仅仅两个月,月活跃用户数就成功破亿,成为IT产品史上月活用户数最快过亿的消费级应用。这也意味着Chat GPT等大语言模型,除了为人们的语言交往和信息交流提供新的动力和趣味之外,还在改变相关行业(比如教育)、简化工作流程(比如招聘)、创造新的产品和艺术内容(比如药品和动漫);甚至重新开启我们对于技术的异想天开式的期望,走向创造一种人类跟机器可以像人跟人一样亲密无间交流的梦幻般未来。

想一下吧!近在10年前,有关业内人士还在壮胆式地高喊:“自然语言处理是人工智能皇冠上的明珠。”没想到,现如今人类似乎已经把这颗璀璨的明珠妥妥地收入囊中了。好事来得实在太快,对此,我们语言学人如果不做出一些反思,无论是关于语言的认识论,还是关于语言学的方法论,好像都说不过去。因为,Chat GPT等大语言模型首先是关于语言的计算模型;其次,它采用的是不被语言学家看好的基于统计的概率方法。比如,早在1950年代人工智能概念刚刚提出的时候,彼时的新锐语言学家乔姆斯基已经声称:基于统计的概率模型不能真正刻画自然语言(Chomsky 1956,1957)。于是,问题就来了:不能刻画自然语言的概率模型,何以能够在语言生成和理解方面都有如此杰出的表现呢?诸如此类的问题,都是在当下Chat GPT等大模型高歌猛进的语境下,具有理论兴趣的语言学家应该思考的问题,更是正在规划自己未来的职业生涯的研究生们必须直面和正视的问题。

为此,我们下面将分别介绍60多年来乔姆斯基对基于统计概率的语言模型的持续质疑,以及人工智能专家Norvig(2011)对他的评论;其中,重点讨论下列语言学理论与计算处理的关键问题:(1)现代大语言模型能不能超越有限状态的概率转移,来捕获语句中不同词语之间的长距离依存关系?(2)现代大语言模型能不能理解和识别“colorless green ideas sleep furiously”(Chomsky 1956:116)之类经典的句法合格但语义异常的句子?(3)对语言的“精确描写”和“科学解释”是否对立?哪一个更加重要?(4)生成语法学的“原则与参数”范式下的范畴语法,对于描写人类自然语言有没有不可克服的困难?(5)语法学的研究取向应该是“句法优先”还是“语义优先”?(6)语言学家可以从语言大模型的成功中获得什么样的经验与教训?

二、乔姆斯基对概率模型的持续质疑

Chat GPT虽然炫酷,甫一出世就技惊四座;但是,说到底Chat GPT等大语言模型都只是一种人类自然语言的可计算数学模型。于是,以研究人类自然语言的结构和功能为志业的语言学家应该是“与有荣焉”了吧?很不幸,答案是否定的。因为Chat GPT等大模型不仅绕开了包括生成语法理论在内的最前沿的现代语言学理论模型(详见Piantadosi 2023),而且使用的恰恰是几十年前被乔姆斯基判了死刑的基于统计的概率模型。比如,Chomsky(1956:113)在摘要中开宗明义地指出:

通过从一个状态到另一个状态的转移来产生符号的有限状态马尔可夫过程(fi nite-state Markov process)不能充当英语语法。并且,随着n的增加,产生英语n阶统计近似的此类过程的特定子类,并不会更接近地匹配英语语法的输出。

Chomsky(1957:17)毫不含糊地指出:

我认为,我们不得不得出结论:……概率模型(probabilistic model)没有对句法结构的基本问题给出任何洞见。

Chomsky(1969:57)又直截了当地指出:

必须认识到,“一个句子的概率”是一个毫无用处的概念,不管从这个概念的什么意义上来说[都是如此]。

半个多世纪以来,乔姆斯基的这一观点一直没有改变。2011年,在麻省理工学院纪念建校150周年的一个讨论会上,主持人平克(Steven Pinker,哈佛大学心理系教授)向乔姆斯基发问:“如何看待概率模型近年来在认知科学领域到处开花的趋势?”乔姆斯基的回应是:(1)

确实有许多研究工作在尝试用统计模型来解决各种各样的语言学问题。其中有一些取得了成功。但是大多数是失败的。

如果不考虑语言的实际结构就应用统计方法,那么所谓的成功不是正常意义上的成功。就科学研究的历史经验来说,这种意义上的成功并非主流。这就好像研究蜜蜂行为的科学家只是对着蜜蜂录像,通过记录蜜蜂的历史行为,加以统计分析,来预测蜜蜂未来的行为。也可能统计方法可以预测得很好,但这算不上科学意义上的成功。研究蜜蜂的科学家并不关心这种预测。

直到Chat GPT火爆出圈、名满天下,乔姆斯基依旧不改初心,在《纽约时报》上跟人合作发表文章,直言不讳地批评Chat GPT等机器学习系统:“只是在随时间变化的概率中进行交互学习,没有提出任何因果机制或物理规律,无法解释英语语法规则;因而,其预测将总是肤浅而又不可靠的。”(Chomsky 2023)甚至在受到Piantadosi(2023)等的猛烈批评以后,仍然在接受社会学家Mirfakhraie的采访时坚称:“大语言模型无法阐明人类语言的习得问题,因为它们只是扫描天文数字量级数据以找到统计规律,并根据它们所分析的庞大语料库来预测在序列中可能出现的下一个单词。”(Mirfakhraie2023)

那么,应该怎样看待乔姆斯基的这些观点呢?下面先从Norvig(2011)说起。

三、现代大语言模型能不能捕获长距离依存关系?

对于乔姆斯基在2011年的研讨会上以及此前的相关观点,人工智能专家、时任Google公司研究主管的Peter Norvig撰文(Norvig 2011)提出异议。首先,他历数了基于统计的语言模型在搜索引擎、语音识别、机器翻译、问题回答、词义消歧、指代求解、词性标注、句法解析等各项自然语言处理任务上的压倒性成功(对世界做出准确的预测),说明乔姆斯基在2011年的那个研讨会上对统计模型的评价不符合事实。其次,他用下面这些例子来说明早期的简单的概率模型的确有问题:

首页 上一页 1 2345 下一页 末页 
上一篇:当代俄罗斯的语言立法与语言关系发展     下一篇:乡村振兴战略下达州市农村人口老龄化问题研究
 
客服老师 3982228081
本站网址 www.txlunwenw.com
郑重承诺 专业团队,保证原创与通过!
童鞋论文网真诚欢迎新老客户的光临与惠顾!
 
 热门文章
· 住宅建设用地使用权续期研究
· 用户锁定效应视角下的网易云音
· 众筹产品创新性对融资绩效的影
· 南京市城镇居民冷鲜肉认知度问
· 摩拜共享单车可持续盈利研究
· 催生地方政府隐性债务风险的原
· 社交媒体中不实信息转发主体心
· 基于网络平台的SPA模式研究——
· 基于游客感知的云台山景区微信
· 新媒体时代背景下乡村旅游企业
 
 推荐文章
· 统一监护制度下父母处分未成年
· 对罪犯未成年子女社会化帮扶的
· 高校服务全民终身学习的角色定
· “三生融合”视角下“景村协同
· 滴滴打车运营现状调查分析
· 广播体操与戏曲的共生之路研究
· 国产荒诞喜剧《我是余欢水》和
· 小微项目学习研学旅行课程的实
· 夜间文化旅游消费的影响因素探
· 高职院校图书馆信息资源生态系
 
 相关文章
· 公证民事案件司法解释的亮点与
· 公证中如何理解适用新物权法司
· 特殊时期标语口号之语言学研究
· 莫言小说《红高粱家族》中性描
· 狐尾藻腐解释放胡敏酸的特性及
· 《红楼梦》中女性人物溢美描写
· 《水浒传》林冲故事中的拒绝描
· 《三个火枪手》中俚语的社会语
· 《白夜行》细节描写的功能及其
· 网络小说《花千骨》的爱情描写

专业指导团队,准时守约,保证原创与通过,十年信誉,品质保证
童鞋论文网提供本科论文、专科论文、毕业论文、职称论文、硕士论文写作指导以及论文发表、论文查重服务
版权归童鞋论文网所有 禁止一切商用盗用