赞
踩
罗煜楚1,吴昊1,郭宇涵1,谭绍聪1,刘灿1,蒋瑞珂1,袁晓如1,2
1北京大学智能学院机器感知与智能教育部重点实验室,北京 100871
2北京大学大数据分析与应用技术国家工程实验室,北京 100871
摘要:信息技术的发展推动了科学研究范式的转变。近年来,社科人文领域也逐渐发展出了数据驱动的研究方式。从可视化的角度,对国际数字人文大会论文进行分析,从任务、数据和应用视角3个层面总结了当前可视化在数字人文中的应用现状。通过分析从人文、可视化技术、艺术3种角度出发的数字人文项目,揭示了多学科交叉对提高数字人文与可视化结合项目质量的巨大潜力。同时,分享了北京大学在探究这种多学科交叉合作新范式的实践,包括交叉人才的教育、学科交叉融合的科普以及相关智能可视化技术的研究等方面。最后讨论了通过探索更好的人与人之间合作及人与计算机之间的协作来促进数字人文与可视化学科交叉发展的展望。
关键词:可视化 ; 数字人文 ; 学科交叉 ; 教育 ; 社科人文大数据
论文引用格式:
罗煜楚, 吴昊, 郭宇涵, 等. 数字人文中的可视化[J]. 大数据, 2022, 8(6): 74-93.
LUO Y C, WU H, GUO Y H, et al. Visualization in digital humanities[J]. Big Data Research, 2022, 8(6): 74-93.
信息技术的发展促使社会发生了深刻的变革,推动了学术研究中数据驱动的第四范式的诞生。自然科学领域很早就开始了对大规模数据驱动的研究,如天文学家对大量观测数据进行收集和分析,从而发现关于宇宙的新知识。近年来,社科人文领域也逐渐发展了数据驱动的研究方式,传统的人文学科在信息技术的支持下走向大数据,形成人文学科与计算机学科的交叉领域——数字人文(digital humanities)。
在信息技术之中,可视化作为一种与人联系格外紧密的技术,在数字人文研究中一直饱受关注。近年来,可视化在国际数字人文大会的摘要与标题中词频排名第一。本文分析数字人文领域研究中可视化技术的应用与发展。
可视化与数字人文都是在计算机发明后才正式形成的学科,但可视化与数字人文之间的联系可以追溯到更早的时候。在计算机发明之前,传统人文学科和传统的可视化方法已经有了许多交集。早在数千年前,人们就已经开始使用图形图像表达数据,创作出了地图这类原始的可视化作品,随着文明的发展,也出现了越来越丰富的可视化方法,在各类统计图表被发明后,可视化与人文学科的合作变得更加深入。20世纪计算机的发明带来了强大的计算能力,并赋予了传统人文学科与传统可视化图表新的生命形式,可视化学科与计算人文学科也碰撞出了新的火花。本节从可视化与数字人文的历史谈起,介绍可视化学科与数字人文的发展沿革,并总览性地介绍当今可视化在计算人文研究中的现状。
可视化的历史可以追溯至史前时期。史前时期人类已经通过编制绳结、刻画图形等形式对他们的社会生活进行有效记录。巴比伦人在公元前6世纪就开始制作黏土板地图,记录巴比伦周围的城镇、河流等地理信息,这也是现存最早的地图。随着经济社会发展,人们需要使用更加精细的地图来管理城市和国家。例如,南宋《平江图》石碑详细记录了南宋时期苏州城的城市布局,是目前已知最古老的刻有城市地图的石碑。
从18世纪末期开始,可视化的先驱者发明了更加丰富的可视化形式,用于分析日益复杂的经济形势变化、讲述历史事实等,并将其应用于政治、经济、历史等领域的写作中,以更好地分析数据和支持观点。苏格兰工程师威廉·普莱费尔(William Playfair)发明了折线图、柱状图和饼图等可视化类型,他设计了用于比较英国、丹麦与挪威进出口数据的折线图,清晰地展现了国家间贸易额的变化和贸易顺逆差的变换。法国工程师查尔斯·约瑟夫·米纳德(Charles Joseph Minard)于1869年出版了著名的拿破仑行军信息图,详细展示了法国军队的进军过程和损失情况,并展示了地形和天气对战争结果造成的影响,此外,他还通过在地图上绘制流图表现国家间的贸易情况和人口迁移等经济社会议题。
随着20世纪70年代计算机显示技术的发展和80年代超算模拟、医学等领域大量数据的产生,人们对探索大规模科学数据有了强烈的需求,科学可视化也随之产生和发展。1987年,美国国家科学基金会首次以科学可视化为主题举办了会议,给出了科学可视化的定义,并提出了科学可视化的需求和发展路径。此后,可视化的用途很快被拓宽到了对抽象数据的展示与分析,从而诞生了信息可视化与可视分析的概念。人文社科数据作为常见的抽象数据形式,也是信息可视化与可视分析中重要的研究对象。
现在的可视化技术更强调借助计算机的能力,帮助人们更好地解决数据任务。可视化将人与计算机共同包含在内的数据分析流程及其高效的信息传递能力能够在数字人文研究中发挥重要作用。
数字人文概念的前身是“人文计算”(humanities computing)[6]。在计算机被发明之后,人文学科的研究者敏锐地观察到了计算机快速处理数据的能力,从而提出人文计算方法,即利用新兴计算工具辅助传统的人文研究。在世界第一台通用计算机诞生仅仅3年之后的1949年,罗伯托·布萨(Roberto Busa)获得了国际商业机器公司(International Business Machines Corporation,IBM)创始人托马斯·约翰·沃森(Thomas John Watson)的支持,开始尝试使用计算机为海量文本编制词语索引(index),这也是人文计算实践的开端。
近20年来,随着计算机技术与多媒体技术的发展,计算机的存储与运算能力更加强大,在文本之外,人文研究中的大量图片、音频与视频等多媒体信息也可以被计算机处理与分析。计算机的能力早已不再局限于简单的统计与计算,在计算机领域,可视化与可视分析、数据挖掘、知识推理、智能检索等数字技术都能与人文学科碰撞产生新的火花,计算机参与了人文学科研究的各个阶段,计算机学科与人文学科的交叉使人文研究进入新阶段——数字人文时代。
数字人文科研社区的形成可以追溯到人文计算时代,1964年IBM在美国约克城高地(Yorktown Heights)组织了关于人文计算的研讨会,并出版了《文学数据处理会议论文集》(literary data processing conference proceedings)。20世纪80年代,陆续出现了关于人文计算与数字人文的学术组织、期刊与国际性会议,如文学和语言计算协会(Association for Literary and Linguistic Computing,ALLC)、计算机与人文协会(Association for Computers and the Humanities,ACH)、《数字人文季刊》(Digital Humanities Quarterly, DHQ)等。2002年于德国图宾根大学(Tuebingen University)举办的文学和语言计算协会与计算机与人文协会联合会议(ALLC/ACH),发起了成立数字人文组织联盟(Alliance of
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。