跳转至

资料来源

简繁混用

本页内容存在简繁混用。部分繁体字来源于所引用资料所指定的引文内容,作者直接复制粘贴所致。

外部链接

本页具有大量外部链接,你可能会因为这些站点的原因有时候无法顺利访问、或无法浏览完整内容:

  • 微博和豆瓣不在登录状态;
  • 需要高校、企业等机构账户或个人账户的;
  • 地域影响不能访问的。

未完成

本页的文字与可视化图表主要基于 v2.0.0,v2.1.0的更新内容尚未完全按照规范的格式同步。

总览

截至2025年9月(版本v2.1.0),古代人名生成器所使用的人名资料有以下来源:

如何访问和使用这些资料

如系网络公开的电子资源,点击对应链接即可访问。出版的书籍,除了线下借阅或购买,以下书籍具有官方在线阅读途径:

  • 《西夏姓氏辑考》
  • 《居延汉简人名编年》
  • 《长沙简牍研究》

此外,中國歷代人物傳記資料庫(CBDB)可以使用以下方法检索人物:

详细收录情况

数据库

来源选项页中,标为数据库的秦朝到清朝的各个时期之人名数据,来源于:

  • CBDB(可参CBDB的资料来源(1))。

    1. 有心之人将会发现本部分的内容架构大量参考了CBDB的说明。
  • 知识图谱。

  • 女性人名:

    • 宋辽金元女子名录。
    • 二十五史及各朝代墓志中古代女性名录。
    • 闺媛典。
    • 从知识图谱与 CBDB 中提取的、标注为女性的人名。

其中闺媛典的人名由程序从文本中匹配提取,其余人名来源及人名的特点可参考原网页的内容。

这一部分的人名数据规模请参考下一节重合状况

简牍

标为简牍的数据,来源于对应简牍的人名索引。得益于简牍资料的公布及整理结果的出版发布,这部分的数据实际上非常可观。

简牍人名的重要性

……对历史学研究而言,这类索引(指人名、地名、纪年三种索引)非常重要。

——游逸飞《评陈伟<里耶秦简牍校释>第一卷》

不妨大胆推而广之。尽管这类人名在非学术的使用场景中可能缺少受众,但在年代和人物身份上,是古代人名不可或缺的一部分,也是非常重要的。在 v2.0.0 版本中加入这部分的人名,我们可以说,填补了生成器很大一部分空白。

新材料的独特性

需要注意的是,出土文献中的人名资料在身份、用字等方面的特点都与传世文献有所区别,可参此篇短文:墙斯《出土文献中的名字训诂》,中国社会科学网,2025年。

由于来源与文本介质的不同,采用了不同的处理和计数方法:

里耶(一)的人名索引是网上公开下载的pdf文件,(二)的人名统计表载于简帛网。所以在录入(复制)方面没有问题。

比较麻烦的是双名是否有姓氏的判断。作者结合原简文、释文、相关文献尽量进行了客观与主观的判断,实在无法判断的就放之不论。详情请见附:里耶秦简多字姓名判断

计数方面,(一)的人名索引按照所陈列的简号计次——也就是说,实际上是该人名的出现次数。由于索引本身所列的人名并不重复,目前也缺乏不同地方所出现的相同人名是否为同一人的系统性研究,目前只有以出现次数代替实际的人口分布作为频次。(二)的人名统计表则单独列出不同简中的相同人名,所以直接按此计数。

里耶秦简(一)的人名索引计入673个人名,共计1982次;(二)的人名统计表共计1301个人名。

此部分人名均来自《居延汉简人名编年》一书,人名通过图片识别提取。由于人名已经按照时间顺序排好,每一节又附有对人名的详细考据,姓氏的存在与否不难判断。

书中已经尽可能地推断了人物身份,因此偷懒直接一个人名计一次。

共计入1141个人名,其中西汉时期的759个,东汉时期的127个,新朝时期的255个。

此部分人名来自《肩水金關漢簡校釋》所附《金關漢簡人名索引》,系作者线下借阅后扫描识图提取。未及一一与原简文对比,其中双字名的姓氏判断,是通过结合金关汉简人名本身的统计特征、居延汉简的人名特征、相关文献得到的。

其中的部分姓名可能为人物的字,一并计入。计次方法同样是一个人名计一次。

《索引》中的人名,共计7011个,其中有306个我不太能确定是否有姓氏的,暂时不录。

得益于所处时期,这部分的人名非常整齐。港中文网站上的田家莂全文檢索資料庫是 Excel 表格,所以直接提取就行。《竹简(一)》所附的人名索引与女名频度表,扫描识图提取。

需要注意的是,《竹简(一)》所附的人名索引,“包括姓字清楚、名字不清楚的姓名,不包括姓字不清楚、名字清楚的姓名”(系列后续出版的也有无姓人名的索引);而女名频度表也来自《竹简(一)》恰好只有名字、没有姓氏。所以这两个来源理应在使用时同时勾选、互相补充。

尽管有些人名对应了多处页码,但作者并没有时间数页码的数目。考虑到有重复人名的存在,这些对应了特别多页码的人名大抵是无法确定人物身份(也就是所属地区的)的,所以依然采用一个人名计一次的做法。

田家莂的人名计入1524个;《竹简(一)》计入1711个;女名共计入383个字头,总计584次。

这些人名来源材料互不重复,计数如下:

可视化图表

本节的可视化图表均可交互,由 Apache ECharts 渲染。此 Javascript 库具有良好的中文社区生态(1),理论上没有加载问题。基于处理人名阶段所得到的重合统计数据,可视化图表的代码完全使用 Gemini 与 ChatGPT vibe coding生成。作者本人显然具有完全手动编程的能力,但没有必要花这个时间。数据已经校对,并无错误。

  1. 古音小镜是大量采用 Apache ECharts 制作可视化图表的一个熟悉例子。您可以通过检查能否顺利使用古音小镜的对应功能来确认浏览器环境与网络是否支持。

如本页中的图表没有渲染,请尝试点此重新渲染、刷新页面、或查看表格。

西夏

西夏的人名均从同一本书提取,所以单独归为一类。一个人名计一次。共计589个有效人名,其中蕃姓人名226个,汉姓人名363个。对于没有有效对应人名的姓氏,在后续拆分姓名构件时单独计一次。对于蕃名人物的种族,我尚未作进一步的细分。

不同数据来源间的重合状况

在处理数据的阶段,对知识图谱与CBDB的人名进行了简单排重,但女性人名与出土文献不做排重,理由如下:

  • 女性人名。由于女性人名的缺乏,目前的处理方法是过采样,加入到各个朝代之中,所以排重并无必要。
  • 出土文献。现使用的各个来源彼此之间、且与其它类型的数据之间并不重复。

知识图谱与 CBDB

由于目前使用了两个数据库,所以需要对重复的名字进行检查。目前采取的是人物生卒年的粗略判断方法。对于知识图谱与CBDB二者皆收录的时期,粗略的重合度估计(1)可以参照以下图表:

  1. 重合度定义为:在两个数据库中都有的人名数/知识图谱的人名数(%,相同人名不重复计数)。各项人名数均为不重复计数的结果。表格第二列为第三、四列之和。

时期 在知识图谱中出现的CBDB的人名数 # 总人名数 # 知识图谱 # CBDB 重合度(%)
秦朝 3 372 356 16 0.84
西汉 165 1957 1606 351 10.27
新朝 7 467 456 11 1.54
东汉 210 2662 2235 427 9.40
三国 170 1775 1446 329 11.76
西晋 127 1492 1118 374 11.36
东晋 194 2255 1743 512 11.13
隋朝 205 2634 1971 663 10.40
南朝 538 3427 2267 1160 23.73
十六国 36 469 353 116 10.20
北朝 464 3433 2117 1316 21.92
初唐 822 14404 3072 11332 26.76
盛唐 536 8578 2830 5748 18.94
中唐 860 12440 3461 8979 24.85
晚唐 321 5575 2240 3335 14.33
唐朝之补充 665 18262 1817 16445 36.60
五代十国 527 6516 4561 1955 11.55
北宋 5698 34873 13813 21060 41.25
南宋 4111 35305 15431 19874 26.64
宋朝之补充 1326 32987 5230 27757 25.35
辽朝 103 679 380 299 27.11
金朝 206 1967 1301 666 15.83
元朝 3123 26608 5592 21016 55.85
明朝 24327 164323 35340 128983 68.84
清朝 18023 234035 33140 200895 54.38

女性人名来源一览

其中女性人名的来源,同样仅根据人名区分,我们有以下结果。

  • 使用最下方的时间轴切换时期。
  • 对于每个时期的人名,有1~5个来源:知识图谱, CBDB, 宋辽金元女子名录, 二十五史及各朝代墓志中古代女性名录(简称"古代女性名录"), 闺媛典
    • 对于每个来源,其独有的人名数,体现在对应的节点上;
    • 两个来源共享的人名数,体现在两个节点相连的边上;
    • 不少于三个来源所共享的人名数,体现在这些来源所对应节点的超边(superedge)上,在图表中以淡灰色的圆形区域显示(这些区域是可以拖拽的)。
  • 悬停在节点、边或超边上时可获知相应的人名数目。节点的大小、边的粗细、超边填充颜色的浓淡代表了人名数目的大小。

数据重复

古代女性名录在唐朝的四个时期尚未区分,故其代表的是相同的数据。

作者已经知悉但未加入的来源

囿于时间精力以及所在地域等等因素,作者尚未加入以下人名资料:

考虑到材料重合度及材料类型,未加入:

  • 大庭脩《居延漢簡索引》,関西大学出版部, 1995。
  • 单印飞《〈里耶秦简牍校释(第一卷)〉人名统计表》》,《简帛研究 二○一四》,桂林:广西师范大学出版社,2014年,第93页。
  • 劉琴麗《漢魏六朝隋碑誌索引:全六冊》,北京:中国社会科学出版社,2019年。
  • 沈思聰《肩水金關漢簡人名索引與釋文校訂》,復旦大學碩士學位論文,2018年。

考虑到涵盖的时间范围,未加入:

  • 战国时期的简帛人名资料。

古代人名生成器历史版本的数据来源

草创时期

随便写写的选择。

v1.0

维基文库的二十四史文本(目录)

v1.1

维基百科的中国各朝代史书人物列表

质和量的飞跃

v1.2

完全替换为:

  • 知识图谱的人物库。
  • 宋辽金元女子名录。
  • 二十五史及各朝代墓志中古代女性名录。

v1.3

  • 对 v1.2的各部分来源数据进行了补充。
  • 加入了《西夏姓氏辑考》的人名。