在Facebook上關注我們,隨時得到最新消息 在Twitter上關注我們,隨時得到最新消息 在新浪微博上關注我們,隨時得到最新消息 在豆瓣上關注我們,隨時得到最新消息
中國哲學書電子化計劃

語意鏈接

所謂「語意鏈接」指數據庫中某一特定出處中的詞語(即一個token[殊型])與CTP字典中的某一種解釋(type[類型])之間的鏈接。鏈接的目的是使得系統能夠識別一個字或字串的哪些出處對應於哪些詞的哪些用法。一般來說,電腦系統很難以判斷同一個字在不同脈絡中的用法或含義:例如,在哪些句子中「墨」指黑色顔料,哪些指墨家學派,而哪些屬於複合詞「墨子」或「墨翟」。人工輸入的語意鏈接訊息使得系統能夠按照字的不同用法處理。由於這些訊息一般來說只能人工輸入,而不能由電腦程序自動產生,所以目前還不能對數據庫中所有的字詞作識別。

字典項目

語意鏈接訊息其中一個用途在於實現具有例句的字典項目。由於系統能識別哪些「墨」表示「黑色顔料」而哪些指墨家學派,因此就能提供不同用法的範例。數位化系統與傳統出版物不同,理論上所能提供的範例只限於古書中實例的總數。為了節省空間,字典一般列出五至十個範例,只要點擊項目右手邊的鏈接,即可在對應的數據庫中檢索系統所知道的所有出處。

人名檢索

除了提供字典項目之外,語意鏈接訊息還表示不同專有名字之間的同義關係。針對古書檢索系統校常見的批評在於依靠純文字檢索的方式查資料很容易讓人忽略文字不完全相同的重要出處。舉一個簡單的例子,假如說想知道古書中有關儒家思想家荀子的出處,首先可能會輸入「荀子」來檢索,卻只會看到幾項符合的資料。進一步用荀子的姓名「荀卿」檢索,則有校多的資料了。但如果停留在這一步,就會忽略很多其它相關的資料。雖然荀子常稱為「荀卿」,但也有不少資料稱之為「孫卿」或「孫卿子」,也有以姓氏「荀」來指稱他。

另外一個相關的問題是文字檢索有時候會找出不相關的資料:可能會有「荀子」兩個字出現,卻不指稱儒家思想家荀子。一個校明顯的例子是「桓公」:雖然大多數出處指公子糾的弟弟小白,但也有很多指不同的桓公。同樣,檢索「孟子」雖然會找出很多指稱儒家思想家的出處,但也會有指稱諸侯夫人的出處。

針對這些問題,本站的文字檢索功能在檢索字典中已有的人名時會警告讀者,也會提供相關的檢索建議以便讓讀者能夠找出相關的資料。讀者也可以直接透過高級檢索功能或字典項目中的鏈接在數據庫中直接檢索字典項目的出處。