中国哲学书电子化计划 | |
简体字版 |
维基格式及编辑指南
结构
维基区中的原典由一个或多个单位组成。每一个单位具有标题(如:“里仁”)、序号(如:“4”)以及相关内容(如:《论语里仁》篇的正文)。一般来说这些单位对应于底本中已有的区分,例如篇或卷。如果原典文献本身较短,则维基项目会只有一个单位,单位名称与原典名称相同(如:“三字经”)。每一个单位应当包括所有对应的文字和子单位。例如:
维基项目标题:论语 | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
...
|
维基项目标题:三字经 | ||||||
---|---|---|---|---|---|---|
|
通过下述说明的方式,一个单位可以包括多数个子单位,但要避免使得单位过长:
维基项目标题:玉堂丛语 | ||||||
---|---|---|---|---|---|---|
... |
版本
为了确保各位的共同努力可以达到良好的编辑效果,每一个维基原典项目应该列出适当的早期版本作为维基电子版的底本。每当编辑维基时,维基电子版中每一个汉字应该与底本中的汉字完全一致。如果您认为底本本身有误,而只能校正底本中的内容才能说得通,请不要直接修改维基原文使得它符合您认为正确的文字或出现于另一个版本的文字,而使得它不符合底本。遇到这种情况时,请使用下列介绍的标记,表示原底本有某些字,但需要改为另一些字。例如:
在修改维基时,若因参考图书馆中的底本而修改原文,请在“修改摘要”贴上电子图书馆对应页面的链接,便利他人确认您修改的有效性。
标点符号
维基区中的原典可使用的标点符号如下:
符号 | 用法 |
---|---|
。 | 句号。用于句子与句子之间。 |
, | 逗号。用于动词词组之间。 |
、 | 顿号。用于名词之间。 |
! | 感叹号。 |
? | 问号。 |
「 」 “ ” | 引号。用以包含引文。注意:提交编辑时,“和”将会被系统自动标准化为「和」。 |
『 』 ‘ ’ | 引文中的引号。注意:提交编辑时,‘和’将会被系统自动标准化为『和』。 |
【 】 | 表示其包含的文字为该段落的分类或类型(如:【疏】)。 |
《 · 》 | 书名号。当书名包括著作名和篇名时,可以在著作名称和篇名间使用·号区分。书名号限用于指出著作时,而篇章标题本身不应该输入书名号,因为系统会在显示时自动增加。 |
● | 缺字号。表示电子版暂时缺少底本中存在的一个汉字(如:该字尚未被统一码标准收入,或暂时无法输入)。 |
□ | 表示底本本身缺少一个汉字,或者因为底本本身以某种方式指出原典在此处缺字,或因为底本在此处有损害无法辨识文字。 |
特殊功能字符
维基区资料的输入和编辑中,个别字符具备特殊功能和意义。这些字符必须如下使用:
字符 | 用法 | 例子 | 例子将显示为 | ||
---|---|---|---|---|---|
* | 在行首代表此行的内容是该单位中的最高层次标题。注意:单位的标题不需要这样输入,而只有在“标题”栏输入即可。 | *记游 |
| ||
** | 在行首代表此行的内容是该单位中的第二高层次标题。 | **记过合浦 |
| ||
{ } | 表示{和}之间的文字以大字显示。一般用在注释本的情况。 | {染于苍则苍,}《广雅释器》云:「苍、青也。」 |
| ||
{{ }} | 表示{{和}}之间的文字是底本中的注释,并且要以小字显示。一般用在原典并非经典文献的注释本但包括注释的情况。 | 《河图》曰:元气闓{{音开}}阳为天。 |
| ||
{{{ }}} | 表示{{{和}}}之间的文字是底本正文以外的注释,例如页边上写的注释。 | 王,{{{王旧作命。改之}}}曰:乌宓,父师, |
| ||
[回车] | 段落分号。段落应该是具有完整意义的文字,不应该以“ ‘ : , 、等符号结束。 | ||||
| | 表示原典中应该在此处换行,但上下的内容都属于同一个段落。 | 关关雎鸠、在河之洲。|窈窕淑女、君子好逑。 |
| ||
●=文字描述= | 用以表示电子版在此处缺一个汉字,同时提供所缺少的汉字的结构说明。 | 山林谁问●=上「髟」下「丐」=萧萧。 |
| ||
【 】 | 表示【和】之间的文字要反白显示(黑色背景白色字)。使用时要与底本保持一致。 | 【指归】 |
| ||
〖 〗 | 表示〖和〗之间的文字要画圈。使用时要与底本保持一致。 | 〖指归〗 |
|
上传新原典全文的方式
当使用“上传新资料”页面上传新的原典文献时,无论原典内容的长短,请如同单位内的输入方式输入标题符号。上传时,系统蒋会自动把您所输入的最大层次的每一个标题及其相关内容变成新的独立单位。例如,假如要上传《论语》全文,则“上传新资料”页面上应该输入:
子曰:「学而时习之,不亦说乎?...
...
子曰:「不患人之不己知,患不知人也。」
*为政
子曰:「为政以德,譬如北辰,居其所而众星共之。」...
...
*尧曰
尧曰:「咨!尔舜!天之历数在尔躬。...
...
这会使得系统创建一个由二十个新单位所构成的原典项目,其中每一个单位对应于《论语》中的一篇。
XML标签
系统使用下述XML标签以实现相关功能。大多情况下,系统会自动管理这些标签;除特殊情况外,请不要增加或修改这些标签。
XML码 | 用途 |
---|---|
<scanbegin.../> | 连结文本和影印资料。 |
<scanbreak.../> | 连结文本和影印资料。 |
<scanend.../> | 连结文本和影印资料。 |
<picture.../> | 把插图加入文本资料。 |
<character.../> | 把统一码外的汉字加入文本资料。 |
<entity...>...</entity> | 标注文本中的命名实体(如:人名、地名等)。 |
后设资料
每一项维基区中的原典文献有后设资料记载文献的相关内容,这些资料可以通过原典目录页上的“编辑”连结显示或修改。修改后设资料时,请注意以下方面:
标签
“标签”项目可输入下述几种标签内容,控制原典在本站系统中的处理。除了下述表格中的标签外,“标签”项目不应该输入其它任何资料。如果需要使用两个以上的标签,在标签之间输入“,”号。
标签 | 意思 |
---|---|
TEXTDB | 该文献是原典资料库中的文献,不是维基区中的文献。维基区的文献不应该输入这种标签。 |
WORKSET(urn) | 该文献和URN urn所指的文献属于同一个抽象意义上的著作。urn不能和该文献的URN相同。另外,urn所指的文献应该是该著作的代表性文献。 |
OCR_PRIMARY | 该文献是通过字符识别打造的初稿,而且在资料打造时没有其它版本。 |
OCR_SECONDARY(textid) | 该文献是通过字符识别打造的初稿,而且在资料打造时有另一个版本(由textid表示)。 |
OCR_MATCH | 该文献不是字符识别初稿,而是利用字符识别连结影印底本的结果。 |
OCR_FAILEDMATCH(textid) | 该文献是通过字符识别打造的初稿,而且在资料打造时有另一个版本(由textid表示)。该文献之所以被打造是因为当时无法自动连结另一个版本和对应的扫瞄本。 |
OCR_CORRECTED | 该文献是通过字符识别打造的,现在校对工作已基本完成。 |
OCR_CORRECTED(nn) | 该文献是通过字符识别打造的,现在校对工作完成了百分之nn%。 |
REDIRECT(urn) | 该文献已被删除并且由URN urn所代表的文献取代。 |
FORK(urn) | 该文献的文字内容最初是URN urn所代表的文献的复制品。 |
PUNCTUATED | 该文献的整个文字版都有上述说明的标点符号。 |
PUNCTUATED_OLD | 该文献的整个文字版都有旧式标点符号。 |
ANNOTATED | 该文献的文字版至少一个单词有语意链接. |
成书年代
“成书年代”项目可直接输入年份,或以“最早~最晚”各式(如:“101~105”)用在确切的年份不详、有争议等情况,表示成熟年代在最早和最晚之间。修改“成书年代”时,请在“修改摘要”中指出相关证据。
文献、著作、著作集
在本站系统和说明中:
- 所谓“文献(text)”是指基于某本书某一个版本的电子版(如:ctp:wb250388是基于钦定四库全书本《尚书全解》的电子版)。
- 所谓“著作(work)”是原典在抽象意义上的概念,独立于在任何版本中的呈现(如:“《尚书全解》”是一个著作,此著作呈现在ctp:wb250388等文献)。
- 所谓“著作集(workset)”是一个集合,它的成员是代表相同著作的文献(如:ctp:work:wb250388上面所列出的文献)。
- 所谓“代表性文献(representative text)”是著作集中被视为有代表性的成员文献。这一般是从完整性、精确性、是否有图文对照连结或标点符号等方面看来著作集中质量最高的文献。
本站上最常操作的对象是文献,例如原典数据库和维基区中的资料都是文献。其中不少文献所代表的著作呈现在系统上多数的文献中。为了记载和管理文献和著作之间的关系,我们使用“著作集”的概念;从技术上来讲,这是透过“WORKSET(著作集)”标签实行的。 只有相似的文献才适合用WORKSET标签连结。两个文献是相似的若且唯若两者的内容是相似的。另外,文献中的注释被视为文献的一部分。因此:
- 一个有注释的文献和没有注释的文献是不相似的。
- 两个有不同注释的文献一般是不相似的。
- 注释极少(尤其是注释作者不署名)的情况,有注释和没有注释的文献可以是相似的。
- 两个文献可以有不同的书名,而仍然属于同一个著作。
- 两个文献可以有相同的书名和作者,而仍然属于两个独立的著作。
修改WORKSET标签时,请留意:
- 任何文献都只能属于一个著作集。
- 如果文献没有WORKSET标签,这代表该文献属于自己的著作集,由其URN导出。例如,ctp:wb153836(钦定四库全书本《道德指归论》)没有WORKSET标签,因此属于著作集ctp:work:wb153836。一个没有WORKSET标签的文献是著作集的代表性文献。因此,代表性文献都没有WORKSET标签。
- 一个文献的WORKSET标签不应该指出同一个文献的URN(如:ctp:wb153836不应该有“WORKSET(ctp:wb153836)”标签)。
- WORKSET(urn)标签表示该文献和urn所代表的另一个文献都属于相同的著作。urn所代表的文献必须是该著作的代表性文献,因此urn所代表的文献本身应该没有任何WORKSET标签。