中国哲学书电子化计划 | |
简体字版 |
数位人文
数位人文工具
CTP API(应用程式介面)
中国哲学书电子化计划应用程式介面(CTP API)可用于文本挖掘和其它数位人文研究目的,亦可用于扩充一般使用介面的功能,使本站文本内容能直接在相关外部工具内使用(如下述的Text Tools、MARKUS工具等)。
应用程式介面可用在任何程式语言里面。为Python设计的官方组件可用于数位人文教学和研究。另外,Digital Sinology网站上有一系列教程说明如何利用Python组件读取本站文本内容。
关联开放数据和语义网
Text Tools(文本工具)
Text Tools插件提供文本资料的分析、视觉化的强大功能,包括自动分析重见资料内容、正规表示式、n元语法等等。以下有视觉化结果的例子,其具体说明请参考Digital Sinology(数位汉学)网站上有关重见资料和正规表示式的介绍以及dsturgeon.net上的自习教程。
MARKUS
由Brent Ho和Hilde De Weerdt开发的MARKUS平台提供线上工具自动或手动标记命名实体(含历代文献中的人名、地名、时间、官名等)。相关插件使得MARKUS能够自动读取本站的文本内容,即时开始进行标记。
请留意:使用MARKUS必须使用Google Chrome。应用程式介面的部分功能需要学术单位订阅。
数位人文研究
- Sturgeon, D. Unsupervised Identification of Text Reuse in Early Chinese Literature, Digital Scholarship in the Humanities, 2017.
- Sturgeon, D. Unsupervised Extraction of Training Data for pre-Modern Chinese OCR. 30th International Florida Artificial Intelligence Research Society [FLAIRS] Conference, 2017.
另外参考:dsturgeon.net上的学术演讲。