SMP 2018计算历史学论坛


论坛概况

论坛时间:2018年8月4日 16:00-18:00

论坛简介:将计算技术用于人文和社会科学大数据的研究,早已得到了学界的共识。本次论坛邀请了来自计算机和历史学领域的四位专家讲者,他们分别是清华大学刘知远副教授,山东大学邱伟云副研究员、南京大学陈静副教授和北京大学胡斌博士。论坛报告的内容涉及自然语言处理技术在计算社会科学方面的最新动态、基于文本挖掘技术的中国近代思想史研究、基于中国商业广告数据库对中国现代社会的建模以及中国历代人物传记资料库(CBDB)的建设与使用。这几位专家讲者将结合各自的领域和研究专长,探讨计算技术和历史学可能产生的碰撞。

论坛主席:江西师范大学计算机信息工程学院 左家莉 副教授

主席简介:左家莉,博士,江西师范大学计算机信息工程学院副教授、硕士生导师。中国中文信息学会社会媒体处理专委会委员,信息检索专委会委员。


论坛嘉宾

清华大学  刘知远  副教授


报告主题:自然语言处理在计算社会科学中的应用
报告摘要:语言是人类交流的工具,也是人类文化的载体,是了解人类社会的重要视角。近年来,自然语言处理为社会科学研究提供了全新的技术工具,特别是面向在线社会媒体的大规模用户产生内容进行用户和内容分析,具有很大优势。本报告将介绍自然语言处理技术在计算社会科学方面的最新动态,探讨该方向的未来发展趋势。
嘉宾简介:刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011年获得清华大学博士学位,已在ACL、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文60余篇,Google Scholar统计引用超过2800次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、CCF-Intel青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会委员、秘书,SCI期刊Frontiers of Computer Science青年编委,ACL、COLING、IJCNLP领域主席。


山东大学历史文化学院  邱伟云  副研究员


报告主题:词汇、概念、话语:基于文本挖掘技术的中国近代思想史研究
报告摘要:运用计算机进行历史研究工作实由来已久,过去一般常见者为经济史领域的相关研究,运用计算机对历史上留下的结构性数据进行统计分析,此种研究偏重统计学,即运用计算机作“一般描述性统计”乃至於“相关分析、回归方程、趋势推论、意义度量、线型规划、动态数列...”等工作,此類计量史学研究中的计算机多是作为统计工具之用。然计算历史学并非仅有计量史学此一发展,在中国史研究方面如1970年代刘广京即透过考察“自强”一词在奏折、谕旨、士大夫议政文章中频频出现现象,探讨清季自强运动的展开过程。又如1971年石约翰(John E. Schrecker)也透过统计《清季外交史料》中“主权”一词出现频度作为认识近代中国民族主义兴起的一个重要参数。由这可见,自1970年代开始有透过文本词汇此一非结构性数据的计算进行历史研究者,开辟出计算历史学的另一研究方向,即从历史文献中的词汇变化去说明历史问题。而自1970年后,伴随文本探勘技术的蜕新,此一以非结构性文本语料为研究对象的计算历史学一派有了更长足的发展与更多元的发挥。 本次報告将以金观涛与刘青峰二先生所建立的“中国近现代思想史专业数据库(1830-1930)”为例,首先指出数据库从1997年建立至今,在约二十年的發展过程中,受到计算机技术迭代与第四范式的影响而产生的三次转型轨迹;其次指出在数据库的三次转型中计算机技术与历史问题意识如何进行双向互动;最后,从过去研究经验中提出一些历史学者從人文理论出发所提出的过去不敢想与不敢作的历史研究议题,期待计算机学者一同完成。希望透过此次報告能让计算机学家对计算历史学发生兴趣,一同为历史研究开辟出更宽广的想像视野,让历史研究能“超越统计,迈向计算”,以计算机之力拓展出历史研究更多的无限可能,此即为本次報告目的所在。
嘉宾简介:邱伟云,山东大学历史文化学院副研究员。2013年毕业于台湾政治大学,获文学博士学位,2014年至2016年于台湾政治大学做博士后研究,2017年任职于山东大学历史文化学院。主要研究方向为中国近代学术思想史、晚清报刊、图像与视觉文化、观念史/概念史、数字人文学。目前为台湾政治大学历史与思想数位人文实验室成员,兼为台湾《东亚观念史集刊》(THCI Core)执行编辑、中国美术学院中国思想史与书画研究中心研究员、《汉学研究丛书‧文史新视界丛刊》主编。主要著有专书:《中国近代平等观念的形成(1895-1915)》(台北:新文丰出版社,2015年9月),并于海内外人文社会科学及数字人文研究重要刊物与会议上发表论文二十馀篇。


南京大学艺术学院  陈静  副教授


报告主题:Advertising Chinese Modern Society: graphesis, concept modeling, historical method
报告摘要:Chinese Commercial Advertising Archive (CCAA) is an expanding collection of metadated, transnationalized, professional grade advertising images extracted from five commercial treaty port newspapers in Chinese cities during the 1920s and 1930s. Commercial ads are historically embedded text/images. Our proposal raises three questions. First, are Chinese neologisms and advertising images connected? Second, does statistical manipulation tell us something new about advertising? Third, when did a new Chinese selling language emerge? Initiated under a Luce Foundation grant (2010-13) Chen Jing (Nanjing University) and Tani Barlow (Rice University) have presented related research jointly and individually over five years. CCAA proposes a concept model rooted in content analysis and designed to reveal connections among modernist fields where visual culture (text/image), commercial power (commodities, advertising industry, global capital) and social theory merge historically. We used an R program to calculate the frequency of combinations of variables from the data and aimed to build a frequency table for each. We used moving average method to analyze combinations over time. Despite holes in our data we have a sense of the relationship among commodity, ads, categories, and years. We work with Prof. Deng Ke, Tsinghua University statistician and using his “Unsupervised Chinese Text Mining via a Statistical Word Dictionary Model” developed for Chinese language text mining. We present Canadian branded Dr. Williams tonic and Japanese Jintan magic medical pills, applying and developing Deng’s methods and expect, particularly in the Jintan case, to consolidate a singular vocabulary and syntax. 
嘉宾简介:陈静,南京大学艺术学院副教授。2009年毕业于南京大学,获文学博士。2007-2008年赴美国杜克大学访学。2009年-2013年就职于上海交通大学人文与艺术研究院。2012-2014年在美国莱斯大学赵氏亚洲研究中心从事博士后研究。2014年起就职于南京大学艺术研究院。主要研究兴趣为:文化与媒介研究、数字人文、新媒体艺术。


北京大学  胡斌


报告主题:中国历代人物传记资料库(CBDB)的建设与使用
报告摘要:中国历代人物传记资料库(CBDB)是由哈佛大学、台湾“中研院”和北京大学中古史中心共同开发的线上关系型数据库,主要收录7至19世纪的人物传记资料共41万余条。库中资料除可用于了解个别人物传记,还可敷统计分析与空间分析之用。本次报告将围绕CBDB的建设历程,讨论数字人文工程展开过程中种种问题,传统人文研究资料与方法的信息化,以及人文研究者在数字人文研究中的地位问题。
嘉宾简介:胡斌,北京大学历史学系2016级博士,研究方向为南宋政治制度史。2017年开始担任CBDB北大小组项目经理。与王宏甦共同开发“中国历代年号线上查询系统”(http://oopus.info/ny/)已上线开放。