首页 >> 经济学 >> 滚动新闻
[演讲]马费成:推进大数据、人工智能等信息技术与人文社会科学研究深度融合
2018年07月29日 07:33 来源:光明日报 作者:马费成 字号

内容摘要:

关键词:

作者简介:

  推进大数据、人工智能等信息技术与人文社会科学研究深度融合

  演讲人:马费成 演讲地点:武汉大学樱顶老图书馆 演讲时间:2018年6月

  

  【演讲人简介】马费成,1947年出生,武汉大学人文社会科学资深教授、国家教学名师、教育部人文社会科学重点研究基地武汉大学信息资源研究中心首席科学家、武汉大学大数据研究院院长。长期从事情报学理论方法、信息资源规划与管理等领域的教学科研工作,承担国家社会科学基金重大项目、教育部哲学社会科学重大课题攻关项目、国家自然科学基金重点项目等国家及省部级科研项目30余项,出版著作20余部,发表论文200余篇。

 

  在这个快速变革和发展的新时代,人文社会科学研究的内涵与外延处在不断深化和拓展之中,电子踪迹、社交媒体、数字文本以及空间位置信息等大规模数据已经广泛渗透应用于人文社会科学研究之中,当代人文社会科学研究的新场景值得我们重视和思考。

  当代人文社会科学研究的新场景

  ·大数据时代,从典型案例探析研究新动向  

  人文社会科学研究的真正价值源自于研究问题。把握人文社会科学研究的发展趋势在于寻求研究问题的解决路径。相同的研究问题可以从不同学科领域、不同角度以及不同侧重点进行分析。在大数据时代,运用信息技术有助于人们更加深入透彻地了解人文社会科学研究中的新动向,例如,进一步跟踪和关注以下具体研究问题。

  第一,实时洞察热点事件。大数据在各行各业的应用,能够即时且最大化的体现数据价值。如央视新闻采用百度定位数据展示春运人口流动图景;印度研制的MogIA人工智能系统用网络数据四次成功预测美国大选结果;谷歌研发的GFT流感趋势预测系统基于用户搜索记录预测美国的流感趋势;等等。过去用传统数据进行研究具有很大的时滞性,而实时性数据的获取,能够有效提升人们发现世界的真实度,人文社会科学研究也可以得到更多有意义的结论。

  第二,解读人类行为规律。社交媒体数据为解读人类行为规律或行为倾向提供了很好的机遇。在过去,研究人的行为主要通过问卷、访谈、实验等方法。现在社交媒体成为提供数据的重要场所,研究人员不需要被测对象响应和配合,也不需要等待被测对象,因此给人文社会科学研究提供了很大方便。

  第三,用科学来破解文学争议。如辨别红楼梦前80回和后40回作者是否为同一作者以及《静静的顿河》的作者之争等等,这些文学问题都可以通过统计分析、数据挖掘、机器学习等手段进行分析。这种用数学解决文学问题的方法有一个形象的说法叫“文学指纹”,即像识别指纹一样来识别不同作家的文学风格倾向。同样,这也体现出文学在研究思维上发生的重大转变。

  第四,宏观分析历史变化。大数据为全面、宏观的分析历史变化提供了充分条件。如武汉大学社会学系龚为纲博士用网络数据分析西方社会民粹主义思潮的历史演变;Maximilian Schich等学者用名人出生地和死亡地的数据研究文化艺术中心的历史迁移问题;等等。过去的研究很难对历史变化有整体性把握,研究结论往往与研究者个人视野有很大关系,只能分析解决局部问题,而数据处理技术和分析手段出现后,我们能够通过数据的直观展示了解到历史变化过程以及历史事物。

  第五,探究重大社会问题。通过数据中隐藏的规律来揭示重大社会问题。过去应对复杂非线性社会问题,最常用的是实证化研究,当时这些研究的解释力度不够。而现在可以用“数据发现逻辑”,解决以往难以攻克的社会问题,有助于国家相关政策的制定以及维护社会稳定。

  我认为,如果数据方法和分析手段运用得当,真正融入人文社会科学的重要问题中,那便是优秀的、具有影响的研究成果。

  ·技术环境变化,创造有利研究条件

  从当前人文社会科学研究场景中可以看出,有许多研究以前行不通而现在可以进行了。实际上是技术环境变化创造了有利的研究条件。

  比如说,现实世界的转换路径:数字化。数字化是一个时代感很强的术语,也是一种常见的现实应用场景,指将复杂多变的信息对象,如声音、颜色、图形、图像等,转换为二进制,由计算机统一处理。从而人们可以在另外一个世界(空间)去研究原来现实中的一些问题。数字化的理念以及数字化工具和技术能力应用于很多领域,解决了许多基础性问题,如数字化书籍、报纸杂志、图书馆、博物馆等等。

  再比如,取之不尽的数据来源:物联网。物联网技术是在互联网基础上实现“物物互联”。这里的“物”能够为认识社会经济现象提供好的研究基础和平台。对于人文社会科学研究而言,取之不尽的数据是科学新发现的源泉,物联网所带来的研究魅力在于数据的获取空前方便。物联网可以获取海量的实时数据,而这些数据是运用传统工具和手段所不能获取的。

  还有就是即时可用的计算环境:云计算。云计算的概念从2006年的搜索引擎大会上提出,到现在已经10多年。它主要是指一种计算资源的共享,带来数据分布式存储和计算,这种分布式存储和计算使得研究人员不再担心传统数据存储和处理的局限。传统统计学的目标是用尽可能少的数据来发掘出尽可能重大的发现,长此以往,研究人员就形成了减少数据收集的习惯,这种缩减实际上是一种人为的限制。而云计算意味着更大的临时存储空间和计算环境,因此给了研究人员一个信心:面对复杂的研究对象,不需要做过多的精减。

  值得重视的移动泛在的信息行为:智能手机和终端。人人持有的智能手机和终端形成了信息获取和信息生产的泛在环境。用户不仅可以无时无刻、随时随地生产数据,还可以获取数据、传递数据。现在,很多数据通过移动手机和终端不断产生、不断传递,使得信息传递模式、人类信息行为表现都呈现出新的特征,而且移动信息服务又与生活经济发展密切相关。这样的变化不仅为研究信息传播、用户行为提供了支持,而且也丰富了人文社会科学的研究途径。

  无孔不入的时空分析:GIS技术。地理信息系统(GIS)技术与人文社会科学研究特别相关,GIS是上世纪60年代研究地理的学者提出来的,主要是为了获取、存储、检索、分析、显示空间的定位数据,随着技术的发展和成熟,其发挥的作用也愈发显著。人文社会科学研究之所以要重视GIS技术,因为其研究对象不仅有时间属性,还有空间属性。人文社会科学中很多现象并不能像自然科学研究中用数学、物理、化学的方法来测量,但是GIS技术为直接或间接研究人文社会科学空间提供了可能。

  数字与现实世界融合:VR/AR技术。虚拟现实/增强现实(VR/AR)技术借助3D模型、感知交互、渲染处理、网络传输等技术,将仿真和现实物理空间融为一体,建造第二自然(也可以称为拟象),实现对物理空间的原型事物的模拟和构建,以及对无原型事物的生成和创造。这类技术可以充分模拟现实世界可能发生的现象、发展的状态,未来可能会成为人文社会科学研究的实验室或者试验场。

  ·不同数据来源提供研究保障

  计算机技术的发展极大地改变和丰富了人文社会科学研究的数据来源。依据不同的标准,可以将人文社会科学研究的数据细分为不同的类别,针对性地应对不同研究。

  依据数据产生的方式,人文社会科学研究数据可以分为被动产生的数据、主动产生的数据和自动产生的数据。被动产生的数据,表示被人和机器共同控制。主要来源于一些业务运营管理系统,伴随移动的运营活动产生并记录在数据库中,如超市、医院、研究机构、交通部门的管理系统中产生的数据。主动产生的数据,表示人的主动权(控制权)较大。这类数据是用户在不同的移动手机和终端,为了交流、交易而产生的数据。自动产生的数据,表示数据的主动权完全归于机器。这类数据主要为机器和传感器数据,如射频识别(RFID)信息、GPS等定位系统数据等。

  依据数据的来源,人文社会科学研究数据可以分为电子踪迹、用户生成内容(UGC)、数字化文本和空间位置数据。电子踪迹数据指用户在使用互联网以后留下来的踪迹,主要包括点击流和搜索日志,如用户点击网络情况、浏览情况以及IP地址等等都属于电子踪迹范围。用户生成内容(UGC)数据,包括社交媒体数据,以及采用群体智慧机制的互联网百科数据等等。数字化文本是电子化处理后形成的文本数据,包括各类数字化图书馆网络数据库存储的文本数据等。空间位置数据是利用GPS等定位系统获取的定位数据。

  依据数据的实时性,人文社会科学研究数据可以分为热数据和冷数据。人文社会科学的研究问题与数据实时性具有一定的关系。有些研究是利用实时性数据研究现实性问题,有些研究是利用档案性数据研究传统性问题。这就反映出研究中数据的热度。据此,可以将反映实时动态的实时性数据称为热数据,将保留多年的档案性成熟数据称为冷数据。

  ·新场景中的新老问题需要重视  

  在新的技术环境和数据产生条件下,人文社会科学研究的问题出现了变化,从本质上讲,这些变化主要包括以下两类。

  第一类是新场景中的老问题。这类问题是人文社会科学研究中一直都存在,只是过去传统技术条件下没有办法揭示的问题。如上述的文学指纹问题、社会思潮以及文化艺术中心变迁问题等等。这些问题,在新场景中借助新的数据来源和获取方式、处理分析工具,能够顺利得到解决。另外,在社会科学当中长期争执的整体与局部的问题,也是这类传统的问题。

  第二类是新场景中的新问题。在新场景当中也出现了过去没有的问题,比如说互联网、数字技术、VR/AR技术所带来的虚拟空间,随之出现的虚拟社区、虚拟企业、人造现实、第二自然,以及由此产生的虚拟犯罪问题、伦理问题,人文科学关注的人的价值问题,实际上都是新场景中的全新问题。这些全新问题今天已经有人提出,但是目前很少看到这方面研究,而这些问题对人类的影响重大。

 

作者简介

姓名:马费成 工作单位:

转载请注明来源:中国社会科学网 (责编:张文齐)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们