资料来源
简繁混用
本页内容存在简繁混用。部分繁体字来源于所引用资料所指定的引文内容,作者直接复制粘贴所致。
外部链接
本页具有大量外部链接,你可能会因为这些站点的原因有时候无法顺利访问、或无法浏览完整内容:
- 微博和豆瓣不在登录状态;
- 需要高校、企业等机构账户或个人账户的;
- 地域影响不能访问的。
未完成
本页的文字与可视化图表主要基于 v2.0.0,v2.1.0的更新内容尚未完全按照规范的格式同步。
总览
截至2025年9月(版本v2.1.0),古代人名生成器所使用的人名资料有以下来源:
- 大部分的数据来自:
- 知识图谱的人物库。
- Harvard University, Academia Sinica, and Peking University, China Biographical Database (CBDB) (July, 2025), 中國歷代人物傳記資料庫(CBDB).
- 女性人名
- @齐秋 老师整理的宋辽金元女子名录。
- @帝企鹅不是鹅 老师整理的二十五史及各朝代墓志中古代女性名录(从汉朝到民国)。
- 《钦定古今图书集成·明伦汇编·闺媛典》。
- 从知识图谱与 CBDB 中提取的。
- 西夏人名
- 佟建荣《西夏姓氏辑考》,宁夏人民出版社,2013年。
- 吐蕃人名(v2.1.0新加)
- 黄布凡、马德《敦煌藏文吐蕃史文献译注》 所附人名索引。
-
简牍
- 青木俊介等編《里耶秦簡(壹)索引稿》,東京外國語大學亞洲非洲語言文化研究所,2021年,第18~79页。
- 胡騰允《<里耶秦簡(貳)>所見人名統計表》,简帛网,2019年9月4日。
- 李振宏、孙英民《居延汉简人名编年》,中国社会科学出版社,1997年。
-
附录《金关汉简人名索引》。见李洪财《肩水金关汉简校释》,中华书局,2024年,第1179~1304页。(1)
- 该书的前言中说明人名索引的制作者系关永强。
-
張光裕、黎明釗製作,劉天朗校訂,長沙走馬樓三國吳簡‧嘉禾吏民田家莂全文檢索資料庫,載香港中文大學歷史系網站,訪問日期2025年04月20日。
- 《长沙走马楼三国吴简•竹简[壹]》附录《人名索引》。见走马楼简牍整理组编著《长沙走马楼三国吴简•竹简[壹]》下卷,文物出版社,2003年,第1124~1149页。
- (v2.1.0新加)《长沙走马楼三国吴简•竹简[玖]》附录《人名索引》。与竹简[壹]属于同系列丛书。
-
走马楼竹简女子人名用字频度表(1)。见王子今《长沙简牍研究》,北京:中国社会科学出版社,2017年,第176~189页。
- 该书的作者附记中说明频度表的制作者系王心一。
-
(v2.1.0新加)韩厚明《新疆出土汉晋简牍集释》中的人名索引表。
如何访问和使用这些资料
如系网络公开的电子资源,点击对应链接即可访问。出版的书籍,除了线下借阅或购买,以下书籍具有官方在线阅读途径:
- 《西夏姓氏辑考》
- 《居延汉简人名编年》
- 《长沙简牍研究》
此外,中國歷代人物傳記資料庫(CBDB)可以使用以下方法检索人物:
- CBDB的API
- CBDB的在线查询系统
-
- 中文在线即许可证中所述具有CBDB在中国大陆独占商业授权的公司。
详细收录情况
数据库
在来源
选项页中,标为数据库
的秦朝到清朝的各个时期之人名数据,来源于:
-
CBDB(可参CBDB的资料来源(1))。
- 有心之人将会发现本部分的内容架构大量参考了CBDB的说明。
-
知识图谱。
-
女性人名:
- 宋辽金元女子名录。
- 二十五史及各朝代墓志中古代女性名录。
- 闺媛典。
- 从知识图谱与 CBDB 中提取的、标注为女性的人名。
其中闺媛典的人名由程序从文本中匹配提取,其余人名来源及人名的特点可参考原网页的内容。
这一部分的人名数据规模请参考下一节重合状况。
简牍
标为简牍
的数据,来源于对应简牍的人名索引。得益于简牍资料的公布及整理结果的出版发布,这部分的数据实际上非常可观。
简牍人名的重要性
……对历史学研究而言,这类索引(指人名、地名、纪年三种索引)非常重要。
——游逸飞《评陈伟<里耶秦简牍校释>第一卷》
不妨大胆推而广之。尽管这类人名在非学术的使用场景中可能缺少受众,但在年代和人物身份上,是古代人名不可或缺的一部分,也是非常重要的。在 v2.0.0
版本中加入这部分的人名,我们可以说,填补了生成器很大一部分空白。
新材料的独特性
需要注意的是,出土文献中的人名资料在身份、用字等方面的特点都与传世文献有所区别,可参此篇短文:墙斯《出土文献中的名字训诂》,中国社会科学网,2025年。
由于来源与文本介质的不同,采用了不同的处理和计数方法:
里耶(一)的人名索引是网上公开下载的pdf文件,(二)的人名统计表载于简帛网。所以在录入(复制)方面没有问题。
比较麻烦的是双名是否有姓氏的判断。作者结合原简文、释文、相关文献尽量进行了客观与主观的判断,实在无法判断的就放之不论。详情请见附:里耶秦简多字姓名判断。
计数方面,(一)的人名索引按照所陈列的简号计次——也就是说,实际上是该人名的出现次数。由于索引本身所列的人名并不重复,目前也缺乏不同地方所出现的相同人名是否为同一人的系统性研究,目前只有以出现次数代替实际的人口分布作为频次。(二)的人名统计表则单独列出不同简中的相同人名,所以直接按此计数。
里耶秦简(一)的人名索引计入673个人名,共计1982次;(二)的人名统计表共计1301个人名。
此部分人名均来自《居延汉简人名编年》一书,人名通过图片识别提取。由于人名已经按照时间顺序排好,每一节又附有对人名的详细考据,姓氏的存在与否不难判断。
书中已经尽可能地推断了人物身份,因此偷懒直接一个人名计一次。
共计入1141个人名,其中西汉时期的759个,东汉时期的127个,新朝时期的255个。
此部分人名来自《肩水金關漢簡校釋》所附《金關漢簡人名索引》,系作者线下借阅后扫描识图提取。未及一一与原简文对比,其中双字名的姓氏判断,是通过结合金关汉简人名本身的统计特征、居延汉简的人名特征、相关文献得到的。
其中的部分姓名可能为人物的字,一并计入。计次方法同样是一个人名计一次。
《索引》中的人名,共计7011个,其中有306个我不太能确定是否有姓氏的,暂时不录。
得益于所处时期,这部分的人名非常整齐。港中文网站上的田家莂全文檢索資料庫是 Excel 表格,所以直接提取就行。《竹简(一)》所附的人名索引与女名频度表,扫描识图提取。
需要注意的是,《竹简(一)》所附的人名索引,“包括姓字清楚、名字不清楚的姓名,不包括姓字不清楚、名字清楚的姓名”(系列后续出版的也有无姓人名的索引);而女名频度表也来自《竹简(一)》恰好只有名字、没有姓氏。所以这两个来源理应在使用时同时勾选、互相补充。
尽管有些人名对应了多处页码,但作者并没有时间数页码的数目。考虑到有重复人名的存在,这些对应了特别多页码的人名大抵是无法确定人物身份(也就是所属地区的)的,所以依然采用一个人名计一次的做法。
田家莂的人名计入1524个;《竹简(一)》计入1711个;女名共计入383个字头,总计584次。
这些人名来源材料互不重复,计数如下:
可视化图表
本节的可视化图表均可交互,由 Apache ECharts 渲染。此 Javascript 库具有良好的中文社区生态(1),理论上没有加载问题。基于处理人名阶段所得到的重合统计数据,可视化图表的代码完全使用 Gemini 与 ChatGPT vibe coding生成。作者本人显然具有完全手动编程的能力,但没有必要花这个时间。数据已经校对,并无错误。
- 古音小镜是大量采用 Apache ECharts 制作可视化图表的一个熟悉例子。您可以通过检查能否顺利使用古音小镜的对应功能来确认浏览器环境与网络是否支持。
如本页中的图表没有渲染,请尝试
、刷新页面、或查看表格。西夏
西夏的人名均从同一本书提取,所以单独归为一类。一个人名计一次。共计589个有效人名,其中蕃姓人名226个,汉姓人名363个。对于没有有效对应人名的姓氏,在后续拆分姓名构件时单独计一次。对于蕃名人物的种族,我尚未作进一步的细分。
不同数据来源间的重合状况
在处理数据的阶段,对知识图谱与CBDB的人名进行了简单排重,但女性人名与出土文献不做排重,理由如下:
- 女性人名。由于女性人名的缺乏,目前的处理方法是过采样,加入到各个朝代之中,所以排重并无必要。
- 出土文献。现使用的各个来源彼此之间、且与其它类型的数据之间并不重复。
知识图谱与 CBDB
由于目前使用了两个数据库,所以需要对重复的名字进行检查。目前采取的是人物生卒年的粗略判断方法。对于知识图谱与CBDB二者皆收录的时期,粗略的重合度估计(1)可以参照以下图表:
- 重合度定义为:在两个数据库中都有的人名数/知识图谱的人名数(%,相同人名不重复计数)。各项人名数均为不重复计数的结果。表格第二列为第三、四列之和。
时期 | 在知识图谱中出现的CBDB的人名数 | # 总人名数 | # 知识图谱 | # CBDB | 重合度(%) |
---|---|---|---|---|---|
秦朝 | 3 | 372 | 356 | 16 | 0.84 |
西汉 | 165 | 1957 | 1606 | 351 | 10.27 |
新朝 | 7 | 467 | 456 | 11 | 1.54 |
东汉 | 210 | 2662 | 2235 | 427 | 9.40 |
三国 | 170 | 1775 | 1446 | 329 | 11.76 |
西晋 | 127 | 1492 | 1118 | 374 | 11.36 |
东晋 | 194 | 2255 | 1743 | 512 | 11.13 |
隋朝 | 205 | 2634 | 1971 | 663 | 10.40 |
南朝 | 538 | 3427 | 2267 | 1160 | 23.73 |
十六国 | 36 | 469 | 353 | 116 | 10.20 |
北朝 | 464 | 3433 | 2117 | 1316 | 21.92 |
初唐 | 822 | 14404 | 3072 | 11332 | 26.76 |
盛唐 | 536 | 8578 | 2830 | 5748 | 18.94 |
中唐 | 860 | 12440 | 3461 | 8979 | 24.85 |
晚唐 | 321 | 5575 | 2240 | 3335 | 14.33 |
唐朝之补充 | 665 | 18262 | 1817 | 16445 | 36.60 |
五代十国 | 527 | 6516 | 4561 | 1955 | 11.55 |
北宋 | 5698 | 34873 | 13813 | 21060 | 41.25 |
南宋 | 4111 | 35305 | 15431 | 19874 | 26.64 |
宋朝之补充 | 1326 | 32987 | 5230 | 27757 | 25.35 |
辽朝 | 103 | 679 | 380 | 299 | 27.11 |
金朝 | 206 | 1967 | 1301 | 666 | 15.83 |
元朝 | 3123 | 26608 | 5592 | 21016 | 55.85 |
明朝 | 24327 | 164323 | 35340 | 128983 | 68.84 |
清朝 | 18023 | 234035 | 33140 | 200895 | 54.38 |
女性人名来源一览
其中女性人名的来源,同样仅根据人名区分,我们有以下结果。
- 使用最下方的时间轴切换时期。
- 对于每个时期的人名,有1~5个来源:
知识图谱
,CBDB
,宋辽金元女子名录
,二十五史及各朝代墓志中古代女性名录(简称"古代女性名录")
,闺媛典
。- 对于每个来源,其独有的人名数,体现在对应的节点上;
- 两个来源共享的人名数,体现在两个节点相连的边上;
- 不少于三个来源所共享的人名数,体现在这些来源所对应节点的超边(superedge)上,在图表中以淡灰色的圆形区域显示(这些区域是可以拖拽的)。
- 悬停在节点、边或超边上时可获知相应的人名数目。节点的大小、边的粗细、超边填充颜色的浓淡代表了人名数目的大小。
数据重复
古代女性名录在唐朝的四个时期尚未区分,故其代表的是相同的数据。
定义
作者已经知悉但未加入的来源
囿于时间精力以及所在地域等等因素,作者尚未加入以下人名资料:
- 《長沙走馬樓三國吴簡•竹簡》系列的其它人名索引。此系列有很多本。
- 《额济纳汉简》的人名索引。
- 《簡帛語言文字研究》第六輯 《尹灣漢簡》人名索引。这本书在作者所能借阅到的图书馆之中没有馆藏。
- 《伦敦藏敦煌汉文卷子目录提要》附录《人名索引》、《燉煌氏族人名集成 : 八世紀末期-十一世紀初期》之氏族人名篇。
考虑到材料重合度及材料类型,未加入:
- 大庭脩《居延漢簡索引》,関西大学出版部, 1995。
- 单印飞《〈里耶秦简牍校释(第一卷)〉人名统计表》》,《简帛研究 二○一四》,桂林:广西师范大学出版社,2014年,第93页。
- 劉琴麗《漢魏六朝隋碑誌索引:全六冊》,北京:中国社会科学出版社,2019年。
- 沈思聰《肩水金關漢簡人名索引與釋文校訂》,復旦大學碩士學位論文,2018年。
考虑到涵盖的时间范围,未加入:
- 战国时期的简帛人名资料。
古代人名生成器历史版本的数据来源
草创时期
随便写写的选择。
v1.0
维基文库的二十四史文本(目录)。
v1.1
维基百科的中国各朝代史书人物列表。
质和量的飞跃
v1.2
完全替换为:
- 知识图谱的人物库。
- 宋辽金元女子名录。
- 二十五史及各朝代墓志中古代女性名录。
v1.3
- 对 v1.2的各部分来源数据进行了补充。
- 加入了《西夏姓氏辑考》的人名。