语言数据是信息时代的生产要素

      最后更新:2020-07-04 10:37:09 手机定位技术交流文章

      正如土地属于农民,机器属于工人一样,计算机可以通过处理和学习语言数据来获取知识和智能,从而为人类创造新的生活

      语言数据是信息时代的生产要素

      作者:李玉明(北京语言大学语言资源高科技创新中心主任、首席科学家)

      随着5G、语言智能和物联网的飞速发展,人类社会正在发生划时代的变化。人类的认知应该随着时代的进步而不断更新,重新审视已经发生的事情,并及时预测将要发生的事情。语言是什么样的现象?语言学是如何发展的?它需要检查和预测。

      1.语言数据是生产要素

      生产要素与生产力发展水平和经济体制密切相关。数据具有生产要素的性质,只有信息化发展到一定阶段,数据才能成为现实并被认识。

      早在2017年12月8日,习近平总书记就提出“建设以数据为核心的数字经济”。此后,“数据是数字经济的关键要素”的主题在2018年4月的“第一届数字中国建设高峰会议”(福州)、2018年5月的中国国际大数据产业博览会、2018年9月的江苏互联网大会和2019年12月的第六届中国国际大数据大会上得到强调。特别是在2018年江苏互联网大会上,工业和信息化部首席经济学家王强调,“以数据为生产要素的数字经济正在成为继农业经济和工业经济之后的一种新的经济形式”。到目前为止,人们已经获得了两个基本的认识:1。数字经济是继农业经济和工业经济之后的一种新的经济形式;2.数字经济的关键生产要素是数据。

      党的十九届四中全会提出“完善劳动、资本、土地、知识、技术、管理、数据等生产要素通过市场评估贡献的机制,按贡献确定报酬”这是对数据具有生产要素性质的理解的总结。数据以及劳动力、资本、土地、知识、技术和管理被认为是第七大生产要素,可以通过市场贡献来支付。这是一个伟大的理论创新,体现了对信息社会的本质认识,并在数字经济快速发展的背景下与时俱进。

      人们普遍认为数据是信息的表现形式和载体。随着科学技术和社会的进步,数据的内涵和外延可能会发生变化。但是现在有一件事是确定的,那就是大多数数据都是“语言数据”。首先,语言(包括单词)是人类信息最重要的载体,大约80%的信息是由语言承载的。没有语言承载的信息,通常需要语言来帮助解释,比如绘画、雕塑、音乐、服装、建筑和其他艺术。其次,语言资源本身也是语言数据。语言数据是最重要的数据,应该属于“生产要素”的范畴。

      语言数据是信息时代的生产要素,就像土地对农民,机器对工人一样,计算机可以通过处理和学习语言数据来获取知识和智力,从而为人类创造新的生活。随着语言智能的发展,语言数据的生产要素属性将越来越清晰。

      6月16日,在世界情报大会期间,智能机器人指挥管弦乐队演奏曲目。新华社

      2.语言数据包含在数字经济愿景中

      20世纪50年代,人类开始尝试机器翻译,并开始训练机器进行语言信息处理。经过文字处理和文字处理的艰难历程,中文信息处理已成功进入语篇处理阶段,努力使计算机具备语言智能。信息检索、自动翻译、机器写作、人机对话等领域的快速发展得益于语言大数据的聚合和应用。

      语言是人类特有的符号系统,这是语言学的经典理解。然而,随着语言智能的发展,语言将为人类和机器所共享。当今最重要的语言交流是“人-机-机-人”交流,它是“人-机”、“机-机”和“机-人”的结合。流行期间的云会议、网上课程、网上购物和网上医疗都属于这种交流方式。如果你和“人形机器人”交谈,会更明显地看到机器有语言。随着物联网的发展,只要在需要驱动的对象中植入“语言传感器”,人们就可以通过具有语言智能的机器与所有事物联系起来,与所有事物进行交流,从而使所有事物都具有“语言智能”。

      2018年12月召开的中央经济工作会议重新定义了基础设施建设,将5G、人工智能、工业互联网和物联网定义为“新基础设施建设”,简称“新基础设施”。在过去一年左右的时间里,新基础设施的内容得到了丰富,外观也逐渐清晰。新的基础设施不仅是信息网络等基础设施的建设,而且使基础设施具有“智能”,尤其是语言智能,从而实现人与万物之间的相关对话。

      许多与信息相关的行业都是语言行业。在更高的工业化时代,根据瑞士语言经济学家的研究,语言产业对社会国内生产总值的贡献接近10%。在信息时代,当数据成为生产要素时,语言产业的经济活力将会大大提高。可以预见,没有语言产业的繁荣,繁荣的数字经济是无法发展的。

      在未来,也许在不久的将来,语言数据将成为一个重要的生产要素,语言将进入一个重要的生产力范畴。收集、管理和充分利用语言数据将成为发展生产的重要任务,语言产业和语言职业将成为数字经济的重要支柱。

      3.语言与物理、社会和信息是“三元空”

      在人类形成之前,世界是自然,只是一个“物理空空间”。随着人类的形成和发展,“社会空空间”在物质空间中成长。语言和社会在0+时一起成长。大约3万到5万年前,旧石器时代,人类有了相对成熟的口头语言,口头语言的载体是声波。大约5000到5500年前,文字出现在两个流域,语言有了新的载体光波。20世纪20年代,广播和电视相继出现,音频媒体使语言成为第三大载波。20世纪末,随着互联网的商业化和语言信息处理的快速进步,人类开始建造一个新的空房间——“信息空房间”,通常被称为“虚拟空房间”和“网络空房间”。潘云鹤院士在《2019年人工智能2.0与数字经济》报告中敏锐地指出,人类正逐步进入由“物理空空间”、“人类社会”和“信息空空间”组成的三元空空间。

      信息空是一个发展中的空空间,其结构和运行机制仍在逐步被认识和完善。但是有一点是相对清楚的,那就是,信息空主要是数字化语言空。语言过去用于社会空,但现在用于社会空和信息空。随着物联网、语言智能的发展和智能新基础设施的实施,语言将进入物理学空空间,并用于人类三元空空间。语言将在人类生产活动中发挥更重要的作用。

      语言不仅是一种人文现象,也是一种有三种媒介的东西:声音、光和电,由人类和机器这两个“物种”共享,并将应用于社会,信息和物理空。语言学作为一门“研究语言及其相关问题”的科学,不应该局限于“语言和文学”,而应该是一门综合艺术、科学和技术的学科。

      2017年10月,美国海勒姆学院提出了“新文科”的教育理念,重组了29个专业,并将新技术融入哲学、文学、语言等课程。这反映了跨学科整合的趋势。中国还积极推进“新工程、新医学、新农业、新文科”建设。根据语言的性质,语言学应该按照“新文科”的思想来发展。只有将语言学与新技术进行整合、交叉和整合,才能适应“数据是数字经济的关键生产要素”的时代和经济体系的命题,促进知识经济的发展,推动智能新基础设施的发展。当然,新基础设施和知识经济的规划者也应该充分重视语言和语言学,并获得语言学的科学红利。

      光明日报(2020年7月4日,第12版)

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/8389.html

          热门文章

          文章分类