白癜风研讨会 https://m.39.net/baidianfeng/a_5781283.html人文大数据及其在数字人文领域中的应用
陈静
南京大学艺术学院,江苏南京
摘要:人文大数据是指基于数字化或者数字生成的,被认为是人文艺术范畴的大规模数据集。与科学、工程及社会科学数据相比,人文大数据是一种“深层数据”,其来源更加混杂、格式更加多样、维度更加多元、数据层次更加复杂、内涵更加丰富,因此在数据分析过程中存在较大困难。针对人文大数据的特点,结合数字人文研究应用中的关键问题,突出人文大数据作为一个集体概念的复杂情况及可能存在的误区,彰显人文大数据的价值。
关键词:人文大数据;数字人文;深度数据;智慧数据
论文引用格式:
陈静.人文大数据及其在数字人文领域中的应用[J].大数据,,8(6):3-14.
CHENJ.Humanitiesbigdataanditsapplicationinthefieldofdigitalhumanities[J].BigDataResearch,,8(6):3-14.
0引言
长期以来,人文学者习惯称呼其研究对象为文本、图像,或是音乐、电影,而非数据。他们主要通过书籍、图书馆、档案馆、博物馆,甚至是手工记录和拍摄等途径获取材料,再通过经验性阅读、主观分析和语言解释的方式加以研究。尽管人文研究中也会涉及一定的信息采集和基于数据分析的定量研究,但人文学者习惯处理基于印刷(print-based)或者实物的材料,并将之视为唯一可信且权威的依据,再以经多年训练和研究获得的学识为基础,展开具有强烈经验色彩的个人研究。这种传统研究除了强调人文研究需要长时间知识生产的积累、承袭外,还高度依赖学者作为个体对材料的占有和处理能力,以及材料本身的原真性和有效性。甚至在一定意义上,材料的质量、真假以及丰富性对于一项研究具有决定性的意义。然而,从20世纪中叶以来,信息通信技术(informationand