大数据时代下的语言研究方法

2022-05-02 03:28:12   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《大数据时代下的语言研究方法》,欢迎阅读!
语言,方法,时代,数据,研究
大数据时代下的语言研究方法

摘要:语言是社会生活的重要组成部分。任何一门学科的发展都离不开科学方法,语言研究更不例外。Chomsky(19551975)介绍了一系列心智主义的观点和数理逻辑的方法,给西方语言学界带来了新的声音。国内的相关研究相对来说起步较晚,到现在有五十多年的历史,从初期的吸纳西方理论到本国实际语言研究方法的阐释,可以看出我国的相关研究呈现可喜的态势。然而,在大数据时代下的今天却鲜少看见语言研究方法的综述。本文采用文献资料法,对所收集到的文资料进行分析,试图对现有研究进行一次概括梳理。 关键词:大数据、语言研究、第四范式 大数据时代下语言研究方法的转变

2013年舍恩伯格和库克耶合著的《大数据时代》一书问世,云时代计算“5G社会等新名词横空出世,数据洪流包裹下的人们迎来了全新的大数时代。大数据时代下,人们的生活变得十分智能与便捷。小到购物时的移动支付、扫码乘车,大到公司通过捕捉用户的搜索信息发现商机。随着大数据以前所未有的深度和广度影响着当代社会,各个领域

都开始寻求新的转变以应对时代的发展,语言学家也开始呼吁语言研究需要新的范式。当下主流语言学研究确实存有问题,布里斯南(2016)就曾将研究的传统语言学比作花园中的语言,他认为这些语料是语言学家们精挑细选的结果,然而日常生活中常见的却是未经修剪的灌木丛式的语言,此时,研究花园那套理论就不再适用。布里斯南强调了语言研究中使用真实语料的重要性,他的观点也得到了刘海涛等学者的认同。

除此之外,刘海涛(2018)分别从研究对象、研究方法、模式选择三个角度提出信息时代下语言研究需要做一些转变以适应社会的发展,为了削弱内省法或定性研究的缺点,研究者应该使用新的研究方法。《大数据时代》一书提出了大数据时代下研究的三个转变:要全体,不要抽样;要效率,不要绝对精确;要相关,不要因果,面对海量数据,研究者可以做到全部数据的研究,可以根据完整的数据信息快速描绘发展趋势,从而达到预测和解决实际问题的目的。这是大数背景下舍恩伯格和库克耶向全体研究者提出的分析信息的三个转变,在语言学研究中也得到了响应。

由以上论述可知,无论是主体的缺陷还是客观形势的变化,都要求语言研究方法的要作出转变。

语言研究的第四范式——数据密集型研究方法

2013年开始,大数据和语言研究相结合的研究开始出现,内容除了大数据在语言学研究中的作用、大数据时代下语言研究方法的趋向,美国博士格雷2007年提出了科学研究的第四范式——数据密集型科研范式。这是继经验范式、理论范式、计算范式之后的又一大创新。第四范式包含了传统研究方法的优秀因素,结合现代信息技术的成果,给语言研究带来了新思路,从本质上来说,它属于量化研究方法的一部分。大数据和语料库有很多相似之处,它们都是利用数据来预测未来的发展趋势。董雪松(2017)提到,大数据能帮助建立新型的语料库进行智能高效的搜索、管理与存储。同时,数据密集型的研究方法与机器密不可分,冯志伟、刘海涛等学者带领他们的团队通过数据密集型的方法进行语言研究并且得出了世界领先水平的成果。 大数据时代下语言研究方法的特点


1 .研究方法多元化

李洪儒(2013)认为出我国传统语言学研究重语料考据而忽视了研究方法的多元化,单一的方法无法得出正确的结论,呼吁语言学家在研究中重视研究方法的多样性。孟春国和陈莉萍(2015)对国内外10应用语言学与外语教学期刊的文章进行调查,发现多元融合的语言研究范式已经成为国际应用语言学的发展趋势。使用多种研究方法共同讨论问题更让人信服,质性研究、量化研究、实验法多管齐下的成果越来越多。 2.研究结果可视化

数据的呈现对研究来说非常重要,大数据时代下的数据可视化呈现给研究告带来了新的活力。阮晓蕾、郑新民和詹卫东(2013)都认为通过可视化界面的呈现,接受者可以直观地把握语言的内在规律。研究结果的可视化特点能够为枯燥的数据增添趣味性,让大数据变得直观易懂。 3 .研究方法跨学科特点突出

学科又叫做交叉学科,表示语言研究跨越了学科的限制而成为从多个学科角度下审视的对象。刘海涛(2016)、骆蓉和钟守满(2016)都对语言研究的跨学科研究做出了探讨。通过查询文献也可以看出,语言学研究确实不单单是语言学的研究,它还涉及心理学社会学、计算机学、理学等各个学科研究不应该拘泥于某一学科的圈子,要多关注其他学科动态,开阔视野,站在更高层面上研究语言。

4 .注重数据的计量处理

基于大数据的背景,语言研究更加注重数据带来的便捷。刘海涛教授(2018指出数据密集型研究范式就是用计量的方法进行研究。他的团队的几项研究成果都是通过实证研究方法进行量化处理实现的。上文也提到,数据密集型研究的本质是量化研究,大数据时代下的计量分析依托于高科技、大数据,比传统的方法更加精密。

结语:我们可以看出,学界对于语言研究的方法越来越重视,这对以后的语言研工作提供了理论基础。尽管大数据的到来给语言研究带来了高效与便捷,但是大数据时代下的语言研究的方法并不是完美的。比如,目前的汉语自动分词和词性标注系统还不能做到毫无争议,汉语机器理解也存在智能化的问题。这就要求语言工作者利用专业知识将模棱两可的语言结构等问题进行统一、完善化并且去发现和整理出更有价值的语言数据。 参考文献

[1]詹卫东. 大数据时代的汉语语言学研究[J].山西大学学报(哲学社会科学),2013,36(05):70-77.

[2]刘海涛,林燕妮.大数据时代语言研究的方法和趋向[J].新疆师范大学学报(哲学科学),2018,39(01):72-83.

[3]骆蓉,钟守满.学科视角的语义关系研究[J].外语教学,2016,37(05):5-10.

[4] Bresnan J. Linguistics: The garden and the bush[J]. Computational Linguistics201742(4): 599-617.


本文来源:https://www.wddqxz.cn/630b6a3cbeeb19e8b8f67c1cfad6195f302be8c9.html

相关推荐