加入收藏 | 设为首页 | 学校主站
新闻中心
 
学院快讯 首页  新闻中心  学院快讯

《德旺大讲堂》第三讲: 陈云松教授谈大数据在人文社科研究中的应用

发布日期: 2019-12-09 浏览次数: 246

2019年1124日下午,由南京大学、河仁慈善基金会、德旺图书馆主办的《德旺大讲堂》第三讲在德旺图书馆一楼多功能厅开讲。南京大学社会学系教授、博导,南京大学-约翰斯.霍普金斯大学中美文化研究中心主任陈云松受邀作题为《中国脉动:大数据视野中的传统文脉与当代社会》的讲座,讲座吸引了福州市200多位大学生、市民朋友前来聆听。本次讲座由南京大学河仁社会慈善学院院长陈友华教授主持。

陈友华教授

陈云松教授基于近年来团队研究成果,运用多来源大数据和量化历史资料,以可视化和远观总揽的方式,凸显大数据视角对于历史与当代的透视价值,多角度呈现中华文脉和当代中国社会脉动的不同侧面,并对如何将人文社科大数据运用到社会科学研究中去进行案例展示。

陈云松教授

一、感受大数据

首先,陈云松教授与大家分享什么是大数据,以及大数据有什么价值。他指出大数据的“4V”特点,即规模巨大、产生高速、种类繁多、真实准确。

大数据有四大的人文价值。第一,大数据纪录真实。比如通过对“LGBT文化”相关词频的可视化分析,可以预测LGBT的发展趋势、规模和分布。第二,大数据重现历史。比如在如何向外国人介绍南京的例子中,大数据证明了外国人对大报恩寺(中国瓷塔)的熟悉程度远甚于其他南京城市标志,从而精准向外国友人推介南京。又如,利用谷歌数字化图书的海量数字化语料库,可以呈现综合性大学的国际历史知名度。第三,大数据澄清事实。比如,根据网民在新浪微博的语言使用数据,发现每年新生低俗热词占总体新生热词的比例仅在6%。而且,此类词汇大多在2-3个月高峰大幅下降,很少成为真正的主流用语。又如,通过分析FatherMotherPapaMama这四个英语词汇在历史文本中出现频率的变动轨迹,可以解释女权意识在近代以来对于传统男权观念的抗争与超越。第四,大数据提供全景。例如,通过对全球30万新闻网站7.2亿个网页,每15分钟抓取的的语言与语调数据库(GDELT)的全体数据进行分析,可以得到全国各国对“China”报道的态度值,可以透视各国媒介的涉华报道有何特征。

二、大数据远观中国文脉

大数据可以远观文化现象。陈云松教授与大家分享他和他的团队如何基于谷歌图书的百万书籍大数据,对国家的传统和当代文化中代表性的“文化符号”(关键词)进行检索和分析,生成不同维度和层面的文化指标,并通过可视化手段对国家文化的历史轨迹、发展历程、变迁图景进行全面展示和比较,来呈现中华文脉。包括朝代更替带来的疆域版图的变化、诗歌背后蕴含的作者生平轨迹、从中国城市近三百年国际知名度的轨迹看综合国力与外交政策的改变、从知名大学关注度看高校发展历程与发展前景、通过对东北青年喊麦歌曲、歌词的文本分析探寻其背后反应出的时代变化和社会心理轨迹等。

三、大数据透视当代社会

大数据可以透视当代社会的现象和过程。比如,基于滴滴出行平台大数据,可以监测全城24小时交通时空变化。又如,通过对妇女儿童走失地点的大数据分析,可以为社会治理提供决策依据。再如,通过对性传染疾病分省检索热度大数据分析,来预测每个地域一周内真实的某类性传染疾病发病的数量。此外,大数据还可以用于分析中国地域空间的文化吸引和穿透。比如,通过计算安徽和上海信息流的强度,可以展示互联网信息流空间里上海对安徽的吸引和优势(称之为“穿透”)。

四、大数据呈现学术中国

大数据可以呈现学术世界中的规律和现象。比如,通过对百度搜索指数的大数据分析,可以呈现人们对不同学科的关注差异。再如,通过对中国顶级人文社科期刊的论文合作结构的大数据分析,可以直观地呈现不同学科论文作者合作情况。陈云松教授又以我国六大人文学科学者的地域合作为例,借助大数据技术清晰直观地呈现出,以胡焕庸线为划分的我国东南地区与西北地区在学术合作频率与规模上存在着巨大差异。

整场讲座陈云松教授妙语连珠、诙谐幽默,既有深刻学术洞见又有详实数据支撑,赢得了在场听众的热烈掌声。

Copyright@ 2014 南京大学河仁社会慈善学院 All Rights Reserved
地址:南京市栖霞区仙林大道163号南京大学仙林校区河仁楼    邮编:210023
电话:86-25-89680963/89680964    传真:86-25-89680964    Email: hrca@nju.edu.cn