中國哲學書電子化計劃 |
數位人文
數位人文工具
CTP API(應用程式介面)
中國哲學書電子化計劃應用程式介面(CTP API)可用於文本挖掘和其它數位人文研究目的,亦可用於擴充一般使用介面的功能,使本站文本內容能直接在相關外部工具內使用(如下述的Text Tools、MARKUS工具等)。
應用程式介面可用在任何程式語言裡面。為Python設計的官方組件可用於數位人文教學和研究。另外,Digital Sinology網站上有一系列教程說明如何利用Python組件讀取本站文本內容。
關聯開放數據和語義網
Text Tools(文本工具)
Text Tools插件提供文本資料的分析、視覺化的強大功能,包括自動分析重見資料內容、正規表示式、n元語法等等。以下有視覺化結果的例子,其具體說明請參考Digital Sinology(數位漢學)網站上有關重見資料和正規表示式的介紹以及dsturgeon.net上的自習教程。
MARKUS
由Brent Ho和Hilde De Weerdt開發的MARKUS平台提供線上工具自動或手動標記命名實體(含歷代文獻中的人名、地名、時間、官名等)。相關插件使得MARKUS能夠自動讀取本站的文本內容,即時開始進行標記。
請留意:使用MARKUS必須使用Google Chrome。應用程式介面的部分功能需要學術單位訂閱。
數位人文研究
- Sturgeon, D. Unsupervised Identification of Text Reuse in Early Chinese Literature, Digital Scholarship in the Humanities, 2017.
- Sturgeon, D. Unsupervised Extraction of Training Data for pre-Modern Chinese OCR. 30th International Florida Artificial Intelligence Research Society [FLAIRS] Conference, 2017.
另外參考:dsturgeon.net上的學術演講。