摘要
作为“计量史学”的分支,“数字史学”是自20世纪九十年代以来,运用文本挖掘、计量分析和数据建模等方法进行历史研究、教学和展示的新兴学科。本文在概要介绍“数字史学”的产生背景、概念内涵和国内外研究现状的基础上,尝试将“数字史学”的理论方法运用于中国古代史学研究文献的可视化分析。 以高校“马克思主义理论研究工程重点教材”中的《中国史学史》教材为基础文献,笔者选择了其中77位有代表性的中国古代史家和92部史学著作。利用中国知网学术期刊库、硕博士学位论文全文数据库、中国图书引证统计分析数据库和万方学位论文库等数据库,收集了研究上述史家、史著的专著1225部、学位论文1995篇、期刊论文6290篇,使用文献计量法分析作者、摘要、关键词、出版来源等题录信息,统计出研究专著高引用量、高产期刊、高产作者、研究热点等信息。进一步,通过四位最富成就与影响力的史家及其著作——司马迁《史记》、班固《汉书》、刘知幾《史通》和章学诚《文史通义》的研究期刊论文摘要进行文本挖掘,旨在对新中国成立至今的中国古代史学研究状况进行全面、系统、深入的考察与分析。 通过使用Python对文本进行清洗建模,构建LDA主题模型,分别提炼主题并分析潜在研究热点等方法,笔者发现新中国成立以来的中国古代史学研究,呈现出较明显的“冷热不均”现象;由于受到非学术因素的人为干扰,对于中国古代史家、史著的研究呈现出阶段性的高潮或低谷(其中尤以对《史记》和《汉书》的研究最为突出)。但同时,笔者亦认识到此项研究所采用的分析工具与理论方法的局限性,以及结论缺乏阐释力和创新性等不足;进而就“数字史学”对于当代历史研究是否具有方法论意义上的进步,及其是否能够推动历史研究的范式转型等问题提出了自己的思考。在当前中国古代史学研究呈现多元化、跨学科趋势的历史背景下,本文旨在为“数字史学”的理论方法运用于历史研究的可行性与可操作性提供一个有益的案例。