3 コアモジュール

Contents

この章では,各種テキストで使われ,どのTEI文書でも使うことが できる要素を解説する. 多くの要素は,どこでも使える,いわゆる自在句としてある. テキスト構造のどこでも使うことが可能である. 但し,何かしらの上位レベルの要素に含まれることにはなる. これらの要素の中には,(例えば,書誌情報の引用やリストに関す る要素では)他よりはよく規定された内部構造を持つものもある. 但し,多くの要素は,内部構造に制限はない. これらの要素の内容は,一般には,数語程度のもので,従来の印刷 されたテキスト中に対応したものになっている. 例えば,フォントの変更,引用符,句点,などのレイアウトに変更 が生じるものである.

本章は,まずはじめに,段落を示す要素pの解説から始める. これは,TEIの各モジュールにある自在テキスト向けの,もっとも 原初的な単位となる. 続く3.2 句点法では, 伝統的な句点法の解釈に関する問題点を解説する. 句点法に関する曖昧な点に対して,本ガイドラインがで提唱する 解決法を示す.

続く3.3 強調部分と引用では,句レベル要素を解説す る. この要素は,一般には,印刷に関する(従って,伝統的なマークアップ言語 で扱われてきた)素性を記録するものである. 例えば,フォントの変更を示したり(3.3.2 強調・他言語など), 引用符を示したり(3.3.3 引用),用語や引用語,解説などの素性を 示したりする(3.3.4 用語,注釈,同等語,解説).

3.4 簡単な編集上の変更では,編集時の手入れ,すなわ ち,校正・修正などを記録する,句レベルの要素を紹介する. この要素は,そのような情報を符号化する仕組みの一部をまとめた もので(11 Representation of Primary Sources),多くの場合で十分に 機能するものである.

続く節(3.5 名前,数値,日付,略語,住所)では,処理 や分析の際に必要となるが,従来の印刷では明示的に指摘されてい ない,句レベル,挿入レベルの要素を解説する. ここでは,名前(3.5.1 参照文字),数値や計測値(3.5.3 数値や計測値),日付や時間( 3.5.4 日付や時間),省略(3.5.5 略語),住所(3.5.2 住所)について扱う.

また,続く節(3.6 簡単なリンクと相互参照)では,相互参照や テキストリンクを符号化するための仕組みの一部を示す. この機能のは,16 リンク,分割,統合にあ る. ここでの要素は,この機能のうち,広く一般に使用される一部である.

次の3.7 リスト3.8 注釈と索引では, 2種類の疑似構造要素,リストと注釈を示す. この2つは,段落や,段落間に出現する塊レベルの要素内で使われ る. リストは,任意の構造を持つことが可能である. 注釈には,元の資料にあるものと,符号化する際に解釈を記録する アノテーションとしてあるものがある. ここでの要素は,この種の機能のうち(17 簡易分析機能),どこでも 使用可能な一部のものである.

続く3.9 図等の非テキスト内容で は,テキスト中に現れる,図や他の非テキスト内容を示す方法を紹 介する. マルチメディアに関する機能の詳細は,14 図・表・式16 リンク,分割,統合で扱う.

続く3.10 参照システムでは, 当該テキストへの参照を実現する機能を解説する. 参照システムの中には,規範を作る団体が規定したものもあり,そ のような情報は,当該テキストを利用することを前提に,記録され る必要がある. また,ある参照システムは,当該電子テキストの制作者や分析者が 独自に定義したものもある.

リストや注釈といった,書誌情報の引用については,3.11 書誌項目の記述または参照で解説する. 書誌情報の引用や参照を符号化する際には,対象となる範囲が示さ れる. このような書誌情報は,自在テキスト中にある句,または書誌情報 のデータベースに相応しい構造を持つ構成要素で示される.

韻文や舞台芸術の一説を符号化するための要素は,3.12 韻文・舞台芸術中の一節で解説する.

本章の最後に,コアモジュールの構造と構成要素を概観する. この内容は,TEI文書の文書型宣言を解説する1 TEIの基礎構造と共に呼ばれ るべきである.

3.1 段落

段落とは,全ての散文形式のテキストにおいて,基本となる構成 要素で,散文を分割する最も小さい単位である. 散文形式は,TEIテキスト中でよく使用され,韻文においても使 用される. 従って,本節で解説する段落は,全てのテキスト種で使われる要 素といえる.

段落には,本節で解説する要素以外の要素もとることが可能で, それそれのテキストの性質に特化した要素を使うことが可能であ る. 本ガイドラインでは,句レベル要素,塊レベル要素,挿入レベル 要素の3種類を想定している. 句レベル要素とは,段落の中に出現し,それ以外の場所には出現 しないものである. 塊レベル要素とは,段落の間に出現し,段落の中には出現しない ものである. 挿入レベル要素とは,段落の中,または段落の間に出現するもの である. 句レベル要素には,強調,引用句,名前,日付などが含まれる. 挿入レベル要素には,書誌情報の引用,注釈,リストなどが含ま れる. 塊レベル要素には,段落自体や,これと似た構造を持つ,例えば, 16.3 区画,分割,アンカーで解説さ れる要素abが含まれる. この要素は,ある種のテキストで段落とされる単位に相当するも のとして使用されるものである.

段落とは,様々な種類の要素の元で使われることから,その要素 内容は,当該テキストの種類により,異なってくる. とりわけ,本章では紹介していない(訳注:他のモジュールで) 付加的に使う要素は,ある種のテキスト中で使うことができるものである. 本章で解説する要素は,全てのテキスト種において使うことがで きるものである.

段落は,要素pで示される.
  • p 散文の段落を示す.

段落の中に,さらに下位区分を必要とするのであれば,要素 sまたは 要素seg を使うことができる. この詳細は,それぞれ 16 リンク,分割,統合17 簡易分析機能で解説する. 段落は,一般には,内部構造をとるものではない. 但し,段落の内容としてある散文中には,各種文字,エンティティ 参照,各種の句,リストや図表などの埋め込み要素,などが含ま れる.

西洋文化では,段落は明示されるのが一般的である. 従って,それを要素pで示すことには,争点はない.

時に,本文中に1つの段落しかないこともある.
<body>
 <p>I fully appreciate Gen. Pope's splendid achievements with their
   invaluable results; but you must know that Major Generalships in the
   Regular Army, are not as plenty as blackberries.</p>
</body>
以下の例は,ニュース記事の典型的な例である.
<head>SARAJEVO, Bosnia and Herzegovina, April 19</head>
<p>Serbs seized more territory in this struggling new country today as
the United States Air Force ended a two-day airlift of humanitarian
aid into the capital, Sarajevo.</p>
<p>International relief workers called on European Community nations
to step up their humanitarian aid to the former Yugoslav republic,
in conjunction with new American aid flights if necessary.</p>
<p>A special envoy from the European Community, Colin Doyle, harshly
condemned the decision by Serbs to shell Sarajevo on Saturday night
during a visit to the Bosnian capital by a senior American official,
Deputy Assistant Secretary of State Ralph R. Johnson. </p>
<p>...</p>
以下の例は,ロシアの童話から取られたもので,他の句レベル要素 (この例ではq による直接話法が示されている.詳細は3.3.3 引用)が,段落間をまたぐ ことなく,段落内に含まれている.
<p>A fly built a castle, a tall and mighty castle.
There came to the castle the Crawling Louse. <q>Who,
   who's in the castle? Who, who's in your house?</q>
said the Crawling Louse. <q>I, I, the Languishing Fly.
   And who art thou?</q>
 <q>I'm the Crawling Louse.</q>
</p>
<p>Then came to the castle the Leaping Flea. <q>Who,
   who's in the castle?</q> said the Leaping Flea. <q>I,
   I, the Languishing Fly, and I, the Crawling Louse. And
   who art thou?</q>
 <q>I'm the Leaping Flea.</q>
</p>
<p>Then came to the castle the Mischievous Mosquito.
<q>Who, who's in the castle?</q> said the Mischievous
Mosquito. <q>I, I, the Languishing Fly, and I, the
   Crawling Louse, and I, the Leaping Flea. And who art
   thou?</q>
 <q>I'm the Mischievous Mosquito.</q>
</p>

3.2 句点法

句点記号は,それが使用する文字集合で使えない場合や,その使用 が曖昧である時に,問題となる. ユニコード文字を使う場合に,この様な問題が起こる. 例えば,ユニコードでは,各句点記号に特定のコードを割り振り, 異なる機能を持つグリフ(例えば,ピリオド,コンマ,ハイフン)を 分けている. 例えば,「ハイフン」の中でも,マイナスの記号,単語を分離する 機能を持つ記号,自動付与される,いわゆるソフトハイフン,改行 が認められない,いわゆるハードハイフンには,異なるコードが付 与されている. 一般的ではない句点記号を符号化するには, 5 標準化されていない文字と字形の表現 で解説されている機能を使うこともできる.

ピリオド は,文の区切,省略,小数点,または数字の添えものとして使 われる. これらは,16.3 区画,分割,アンカーや, 3.5.5 略語や, 3.5.3 数値や計測値で解説される,言語的文 単位,略語,数値とは異なるものである. ピリオドと認定することには,それなりの背景があり,それは, 書記システムにあるどの文字も多義的であることと,違うもの ではない.

疑問符 感嘆符 は, 文の終わりを示すものであるが,時には,文中にコメント( !で驚きなどを, ?で問い合わせや言語学上の 怪しさ)として使われることもある. これらは,言語学的文単位として,区分されることもある. その場合には,文中での用法は,マークアップされないか,ま たは17.1 言語学的区分で解説される要素 cが使われる.

ダッシュ記号 は,様々な用途で使われる. 例えば,挿入,割り込み,新しい発話者(対話時),リスト項目な どを示す. 最後の2つの用例は, 3.3.3 引用で解説され る要素qと, 3.7 リストで解 説される要素item の方を使う方が,それぞれ望ましい.

引用符 は,要素qquote を使う際には,削除されることがある. 特に,引用が必ずしも引用符で示されない場合など,様々な方法 で表現される場合である. 引用やこれに関連する素性については,3.3.3 引用を参照のこと.

アポストロフィー は,一重引用符と区別する必要がある. ハイフンと同じく,この曖昧な用例は,ユニコードでは分けて示 すことができる. 引用符の場合は,先に示したとおり,XMLのタグで明示的に示す ことができる. 一方,アポストロフィーの場合は,様々な使い方がある. 英語におけるアポストロフィーは,短縮形,(時に)複数形の表示 で使われる. これを明示的に分けることは,言語学的分析や解釈のレベルを分 けことになる.

括弧 やダッシュ記号や省略記号などは,テキストの統語上の情報を示すた めに使われることがある. これらの用例を明示的に分けることは,言語学的分析や解釈のレ ベルを分けることになる. この詳細は,17 簡易分析機能にある.

句点記号を機能別にタグを使い明示的分けるには,当該記号を,テ キストとして残すべきか,または除外すべきかを考えることになる かもしれない. 引用符の場合には,ユニコード中の記号を使い,引用の開始と,そ の終了とは,分けて記録される方が,単に要素qと属性 rendを使って示されるよりも,便利か もしれない. どちらの手法を使うかは,当該プロジェクトの目的によって決めら れる.

3.3 強調部分と引用

本節では,各種テキスト素性のうち,印刷物上で一般的によく使わ れるもので,いわゆる「強調」として,例えば下線,斜体,引用符 などで示されるものを扱う. 始めに,ここで扱う現象と,その符号化方法について概説し,続い て,いわゆる強調の為に使われる伝統的な表現方法を符号化する方 法を解説する.
  • 強調,外国語,その他,言語上弁別されている強調
  • 発話,思索,引用などの表現
  • 専門用語,注解など

3.3.1 強調部分とは

「強調(highlighting)」とは, 印刷上の特徴(例えば,フォント,サイズ,色彩,など) により,周囲のテキストとは異なる一節であることが示された ものである. 9 強調は,一般に,読み手の関心を,ある素性に引きつけるた めに使われている. 本節では,本ガイドラインで推奨する,この様な性質を符号 化する手法を解説する.

現在ある印刷されたテキストでは,強調は,以下に関する単語や 句を特定する為に使われている.
  • 外国語,方言,古風,専門用語など,一風異なっている.
  • 強調表現.例えば,話されるときには強勢が付くもの.
  • 本文の部分ではないもの.例えば,相互参照,タイトル,ヘ ダー,ラベルなど.
  • 話線が異なるもの.例えば,無声の独白,解説のナレーションなど.
  • 当該テキストの話し手ではない,テキスト中またはテキスト 外にある他の話者.例えば,直説法,引用など.
  • 何らかの方法で,当該テキストからは離れているもの. 例えば,ことわざ,語られているが使われていない,古いテ キスト中にある人物名や地名,編集上の訂正や追加など.

強調されているテキストが持つ機能には,異なる場所では異なる 表現方法が採られていることもある (例えば,周囲がローマン体のテキスト中にある外国語は,イタ リック体で示されることもあるし,逆に,周囲がイタリック体の 場合は,ローマン体で示されることもある). 従って,当ガイドラインでは,表示方法の符号化と,その背景に ある機能の符号化を分けることにしている.

この様な強調は,グローバル属性 rendまたは renditionで記録されることができる (詳細は1.3.1.1 グローバル属性). これにより,強調されている語句の機能を,適切な要素で特定す ることが可能で,さらに,その強調の様子を属性rendを使い記録することもできる. 強調されている部分の機能を解釈したくない場合には,要素hiを使うこ とで,単に当該テキストが何らかの方法で強調されていることの みを記録することができる.
  • hi 周囲のテキストとは見た目が異なっている語句を示す.
要素hiは, クラスmode.hiLikeのメンバー である.

属性rendで使うことができる属性値 について,当ガイドラインでは,規定していない. 属性rendは,元資料中で当該テキス ト部分が表現されている様子を記録するためのものであり,その字形 は様々な表現方法,例えば,活字体,大きさなどが関連している ことから,様々な情報を記録する必要がある.

本ガイドラインでは,強調されているテキスト部分では,単に強 調されている事実だけを記録するのではなく,その素性について も,適切に抽出できるのであれば,記録することを推奨している. その理由として,以下のようなものがある.
  • 同種の強調でも,異なる文脈中では,異なる目的を持つこと がある.
  • 同じ機能でも,異なる文脈中では,異なる強調のされ方をす ることがある.
  • 分析を目的とする場合には,強調であることが示されている だけよりも,一般には,その強調が意図する機能についての 情報の方が,より有用である.

多くの場合,強調されている部分が持つ機能は,明らかであり, その分析は論点にはならない. 理由は,強調のされ方が変わるという弁別性は,当該ガイドライン の至る所で論議されている弁別性と同種のものだからである. この種の弁別性を記録する要素は,クラスmodel.emphLikeのメンバー である. このクラスに加えて,クラスmodel.hiLikeは,句レベル のクラスmodel.highlightedを構成している. このクラスのメンバーは,句レベルの要素中で,使用することが 可能である.

これら2つのクラスの区別は簡単で,要素hiと要素 emphの違いが,それをよく示している. 要素hiは,ある一節が印刷表現上異なっていることを示すための ものであるが,要素emphは,ある一節が,何らかの目的のために, 言語的に強調されていることを示すものである. これら2つは,同時に使われることも多いが,異なるものである. 但し,当該機能を符号化することが,経済的に無理な場合(例え ば,巨大なコーパス)や,知的権利上,相応しくない場合(例えば, 古い資料から転記する場合や,印刷の様子を研究するための資料 を作成する場合)があることは,知っておくべきである. このようなケースでは,要素hiや,クラスmodel.hiLikeにある 要素が使われる.

印刷上の違いを示す要素でありながら,本節では扱っていない要 素として,要素title(3.11 書誌項目の記述または参照)と,要素 name( 3.5.1 参照文字) がある.

3.3.2 強調・他言語など

本節では,以下の要素について解説する.
  • foreign 記述のベースで使われている言語と異なる言語による語句を定義する.
  • emph 言語学的,修辞学的に強調されるべき語句を示す.
  • distinct 言語上,異なる語句を示す.例えば,古語,技術語,方言,忌諱語など.ま た,特定グループでしか通用しない特殊言語など.
これらの要素は全て,クラスmodel.emphLikeの要素で ある.
3.3.2.1 他言語
当該テキストで使われている言語とは異なる言語の語句がある 場合,その事実以上の情報が,記録されるべきである. 当該語句が既に他のテキストとは異なるものとして符号化され ている場合(例えば,名称,専門用語,引用,既出語など),グロー バル属性xml:langを使い,それが 周囲のテキストとは異なる言語であることを示すことができる. TEIスキームの要素も,属性xml:langを取ることが可能で,これによ り,書記システムと,要素内容で使われている言語を特定する ことができる(詳細はvi.i 言語の識別を参照). ちょうど良い要素がない場合には,要素foreignをとりあえず使い, そこに属性xml:langを付加して, 情報を記録することができる.
<q>Aren't you confusing <foreign xml:lang="la">post hoc</foreign>
with <foreign xml:lang="la">propter hoc</foreign>?</q> said the Bee
Master.
<q>Wax-moth only succeed when weak bees let them in.</q>
要素foreignは, テキスト中で言及・解説されている対象としてある他言語を示す ためには,使わないべきである. そのような場合には,3.3.4 用語,注釈,同等語,解説で解説する要 素を使うべきである. 以下にある例を比べて欲しい.
John eats a <foreign xml:lang="fr">croissant</foreign> every morning.
<mentioned xml:lang="fr">Croissant</mentioned> is difficult to
pronounce with your mouth full.
A <term xml:lang="fr">croissant</term> is a crescent-shaped
piece of light, buttery, pastry that is usually eaten for
breakfast, especially in France.
3.3.2.2 強調
要素emphには,言語上,強調されている語句 が記録される. 字体が強調されているようなテキストは,強調の分類に含まれ, 要素hiで記 録することができる. 印刷物では,一般に,斜体,大きい字体,広い文字間を使って,強 調されていることが示される. 一方,手書き資料やタイプライター文書では,下線を使って,強調 されていることが示される. 以下にある例のように,強調の表現方法を,属性rendに記録することは,選択的なものである. 元資料が,ある素性(例えば,強調や外国語)を,一貫して,ある特 定の手法で表現しているのであれば,それは,TEIヘダー中の 要素renditionに記録することができる. 属性rendは,この初期値から外れるも のを記録するために使うことができる. 例えば,要素emphの表示方法が,その初期値をTEIヘダー 中に記録されている場合には,以下のように使うことができる.
<q>Sex, sir, is <emph>purely</emph> a
question of appetite!</q> Tarr exclaimed.
もし初期値が定義されていない場合には,属性rendを使い,それを指定することも可能である.
<q>What it all comes to is this,</q> he said.

<q>
 <emph rend="italic">What does Christopher
   Robin do in the morning nowadays?</emph>
</q>
要素renditionがTEIヘダー中に使われている場合 (必ずしも,関連する要素を持つ必要はない)には,属性renditionで,これを参照することも可能である.
<l>Here Thou, great <name rend="italics">Anna</name>!
whom three Realms obey,</l>
<l>Doth sometimes Counsel take —
and sometimes <emph rendition="#italic">Tea</emph>.</l>
<!-- in the header ... -->
<rendition xml:id="italicscheme="css">text-style:italic</rendition>
要素renditionの詳細は, 2.3.4 タグ付け宣言にあ る.

要素hiは, 強調された語句の背景にある意図の判別が,難しかったり,特定が困 難であったり,それが不可能であるときに,使われる. この要素を使い,属性rendや 属性renditionを使うことで記録される情 報を,符号化することが可能になる. これにより,強調の機能を特定することなく,その事実を示すことが できる. また,この要素は,当該テキストが2段階で処理される時にも,便利 である. 例えば,1回目の処理では,表示上の区別を行い,2回目の処理で,要素 hi を特定の要素に置き換えるような場合である.

例えば,以下の例で考えてみる.
<hi rend="gothic">And this Indenture further witnesseth</hi>
that the said <hi rend="italic">Walter Shandy</hi>, merchant,
in consideration of the said intended marriage ...
この例では,ドイツ字体・ゴチック体で表現されている最初の強調句は, 法律文書に似せているもので,続いてある斜体の強調句Walter Shandyは,名前であることを示してい る. この文書を,2回目の処理時に,最初の強調句を, 要素headまたは要素labelに置き換え, 2番目の強調句を,要素nameに置き換えることができる.
The heaviest rain, and snow, and hail, and sleet, could
boast of the advantage over him in only one respect. They
often <hi rend="quoted">came down</hi> handsomely, and
Scrooge never did.
この例では,強調句came downは,引用 符で示され,これが言葉遊びであることが示されている. 10 この部分は,2回目の処理時に,要素soCalledに置き換えることができる.
3.3.2.3 言語上,分けておきたい部分

場合によっては,ある語句の言語の違いを,要素foreignを使うよりも,さらに細かく記 録しておきたいことがある. この様な場合,要素distinctを使うことができる. この要素では,属性を使った2つの手法で,言語上の異なりを示す情報を記 録することができる. 属性typeには,利用者が規定したコー ドを付加することができる. これにより,当該語句の使用領域や特殊言語を示すことになる. この属性値について,現時点では,推奨するものはない. 現場で,この値に関するコンセンサスは存在していない.

または,この他の3つの属性を組み合わせて,記述言語学で使わ れるような,例えば,Mattheier et al, 1988にあるような, 3軸の基準で記録することも可能である. 属性timeには,通時的な情報を示す. 例えば,古語,古い言い回し,最新語,斬新語など. 属性spaceには,共時的・地理的な情 報を示す. 例えば,地理的な分類による,国家,地域,国際など. 属性socialには,事情に関する情報 を示す. 例えば,社会階級による,技術的,丁寧,無礼,限定的など. 確認すると,これらの要素の値として,現時点では推奨するも のはない. 符号化する人は,ヘダー中の適切な場所に,当該スキームの解 説を記録すべきである(2.3 符号化解説).

例:
Next morning a boy in that dormitory confided to his
bosom friend, a <distinct type="psSlang">fag</distinct> of
Macrea's, that there was trouble in their midst which
King <distinct type="archaic">would fain</distinct> keep
secret.
Next morning a boy in that dormitory confided to his
bosom friend, a
<distinct time="1900space="GBsocial="publicschool">fag</distinct>
of Macrea's, that there was trouble in their midst which
King <distinct time="archaic">would fain</distinct> keep
secret.
当該語句に,より詳細な(または厳密な)分析が必要となる場合には, 18 素性構造で仮設されている, より細かで汎用性のある仕組みを使うべきである. または,この種の分析情報は,3.8 注釈と索引にある要素note,または, 17.3 部分と解釈にある要素 spanに記録することができる.

3.3.3 引用

手書き・印刷テキストで頻繁に見られる表示形式のひとつに,引 用符を使ったものがある. 本節までに紹介してきた表示の方法と同様に,引用符を使ったも のも,当該テキストにある素性(例えば,直説法といった引用)と, その表示方法(例えば,引用符を使っていること)を分けて記録し た方がよい.

本節では,引用符を使った表現を記録する,以下の要素について 扱う.
  • q 周りのテキストとは(表面上)異なっているようにマークアッ プされている部分を示す.例えば,直接話法や思考, 技術用語や専門語,著者による区別,引用,言及され ているが使われていない一節など.
  • said 考えたり声に出されたりした一節を示す.元資料中に明示さ れているかどうか,間接的な伝聞かどうか,実在の人 物に依るものかどうか,などは問わない.
    direct 引用内容が,直接または間接的な話(法)かどうかを示す.
    aloud 引用内容が言語または記号化されているかどうかを示す.
  • quote 語り手や著者が,当該テキスト外にあるものに向けた,一節を示す.
  • cit 書誌参照を伴い,他の文書からの引用を示す.例えば,辞書の場合には,当 該単語形が出現する例文を示したり,当該見出し語の翻 訳や用例を示したりする.
  • mentioned 言及された語句を示す.
  • soCalled 著者や語り手が,責任を持ちたくない語句を示す.例えば,英語文化圏では, 引用符号で囲んだり,イタリック体で示される部分.
要素mentionedと要素 soCalledは, クラスmodel.emphのメンバー である. 要素qと, 要素saidは,クラスmodel.qLikeのメンバーであ る. 要素cit と要素quoteは,クラスmodel.qLikeの下位クラスで あるクラスmodel.quoteLikeのメン バーである. また,クラスmodel.qLikeは,クラスmodel.interの下位クラスで ある. 従って,上記要素は全て,句レベル要素の間や,その中で使うこ とができる.

引用符の一番重要な使用目的は,「引用」を示すことである. これにより,著者または話者が,当該テキストは他の話声とは異 なることを示すことになる. 要素q は,これ以上の区別が必要でないときに,使うことができる. 但し,当該一節が,周囲のテキストとはある意味で区別すべきと 感じられたときには,上記の要素を使い,それを記録することが できる. そのような典型例として,例えば,要素quoteを 使い,他の作品からの引用であることを示したり,要素saidを使 い,人や登場人物による発語や思索を表現する語句を示すことがある. 要素soCalledは, 著者や話者が,当該の語から距離を置きたい時に,その主体を特 定することなく記録するために使うことができる. 要素mentionedは,当該語句が,本文の一部 としてよりかは,本文で解説している対象となっている時に,使 うことができる.

当該一節が,周囲のテキストとは,何らかの理由で異なっている ことがはっきりとはしない,または関心がない時には,単に要素 qで示すことも可能である.

印刷物の場合,引用は,異なる字形,特別な記号(例えば,一重 引用符,二重引用符,カギ括弧,ダッシュなど)や,レイアウト (例えば,字下げされた形式段落)などで表現される. これら表示の特徴に関心がある場合には,1.3.1.1 グローバル属性に あるグローバル属性rendまたはrenditionを使い記録することができる.

引用符は,他の記号と同様に,属性rendにある情報との連携に関係なく,それ をテキスト中に残しておく方がよいと判断される場合がある. このような場合には,適切なユニコード文字を使い,それを記録 すべきである. もしユニコード文字が直接入力できない場合には,数値による文字参照( 文字参照)を使うことができる.

または,引用符を全て取り除き,その形状を,属性rendで記録することもできる. 例えば,以下のようになる.
<said rend="PRE lsquo POST rsquo">Who-e debel
you?</said> — he at last said —
<said rend="PRE lsquo POST rsquo">you no speak-e,
damme, I kill-e.</said> And so saying,
the lighted tomahawk began flourishing
about me in the dark.
Adolphe se tourna vers lui :
<said>— Alors, Albert, quoi de neuf?</said>
<said>— Pas grand-chose.</said>
<said>— Il fait beau,</said> dit Robert.
Adolphe se tourna vers lui :
<said rend="PRE mdash">Alors,
Albert, quoi de neuf ?</said>
<said rend="PRE mdash">Pas grand-chose.</said>
<said rend="PRE mdash">Il fait beau,</said>
dit Robert.
クラスatt.ascribedのメン バーである要素saidと要素qは,以下の属性を使うことができる.
  • att.ascribed 特定個人に帰する発話や行動を示すを示す要素に付随する.
    who 当該要素の内容が示す人物を示す.
この属性は,誰が話しているのかを明示するために使うことができ る.
Adolphe se tourna vers lui :
<said who="#Adolphe">— Alors, Albert,
quoi de neuf?</said>
<said who="#Albert">— Pas grand-chose.</said>
<said who="#Robert">— Il fait beau,</said>
dit Robert.
<!-- .... -->
<list type="speakers">
 <item xml:id="Adolphe"/>
 <item xml:id="Albert"/>
 <item xml:id="Robert"/>
</list>
属性whoには,当該発話者が,テキスト中に 明示されているかどうかが記録される. 属性値として(上例のように),発話者の正規化された名前を取ることも 可能である. 但し,本来,この属性値には,当該発話者に関する情報が記録されてい るテキストの場所への参照が記録される. この種の情報が記録される一番相応しい場所は,TEIヘダー内で 「participant description」を記録する部分で,この詳細は 15.2.2 The Participant Descriptionにある. 但し,上記の例のように,簡単に記述する際には,当該テキストの前付 けや後付にある話者一覧のようなもので,十分である.
発話と思索を分けた方がよい場合がある. 現在の印刷慣習では,この違いを,字体の違いで示すことが多い. 属性aloud は,これを記録するための ものである. 例えば,以下のようになる.
<said aloud="true">Oh yes,</said> said Henry,
<said aloud="false">I mean
Gordon Macrae, for example…</said>
<said aloud="false">Jungian
Analyst with Winebox! That's what you called him, you callous bastard,
didn't you? Eh? Eh?</said>
引用された部分の中に,さらに引用される部分が含まれることもあ る. 例えば,話者の話の中で,別の発話が示される場合である.
<said who="#Wilson">Spaulding, he came down into the office just this day
eight weeks with this very paper in his hand, and he says:—
<said who="#WilsonSpaulding">I wish to the Lord, Mr. Wilson, that I was a
   red-headed man.</said>
</said>
<!-- ... -->
<list type="speakers">
 <item xml:id="Wilson">Wilson</item>
 <item xml:id="WilsonSpaulding">Spaulding reported by Wilson</item>
<!-- ...-->
</list>
この方法で埋め込まれた直接話法の部分は,どこでも同じように扱 うことができる. 表示方法に違いがあったとしても,同じ要素として扱うことができ る. 場合によっては,外部にあるテキストからの引用を含む直接話法の 部分と,そのようなものを含まない直接話法の部分を,分けて記録 したいこともある. そのような場合は,以下のようになる.
<p>
 <said>The Lord! The Lord! It is Sakya Muni himself,</said> the lama half
sobbed; and under his breath began the wonderful Buddhist
invocation:-<said>
  <quote>
   <l>To Him the Way — the Law — Apart —</l>
   <l>Whom Maya held beneath her heart</l>
   <l>Ananda's Lord — the Bodhisat</l>
  </quote>
   And He is here! The Most Excellent Law is here also. My
   pilgrimage is well begun. And what work! What work!</said>
</p>
他の作品からの引用部分は,参照により示されることがある. 要素citは,当該引用部分と,その書誌情報をまとめ ることができる. この書誌情報は,3.11 書誌項目の記述または参照にある要素で記 録される. 例えば,以下のようになる.
<div xml:id="mm01type="chapter">
 <head>Chapter 1</head>
 <epigraph>
  <cit>
   <quote>
    <l>Since I can do no good because a woman</l>
    <l>Reach constantly at something that is near it.</l>
   </quote>
   <bibl>
    <title>The Maid's Tragedy</title>
    <author>Beaumont and Fletcher</author>
   </bibl>
  </cit>
 </epigraph>
 <p>Miss Brooke had that kind of beauty which seems to be thrown into
   relief by poor dress...</p>
</div>
他の書誌情報と同様に,当該引用部分を,参照として示すことも可能で ある. 例えば,以下のようになる.
Lexicography has shown little sign of being affected by the
work of followers of J.R. Firth, probably best summarized
in his slogan, <cit>
 <quote>You shall know a word by the company it keeps.</quote>
 <ref>(Firth, 1957)</ref>
</cit>
本章で解説される他の要素とは異なり,直接話法や引用は,より上位レ ベルの要素,例えば,段落や韻文行を,その中に取り込まれるだけでは なく,それを含むことがある. この様な構造上の問題には,以下の3つの解説策がある.
  • 引用部分を下位区分に分けて,各下位区分を段落の中に埋め込む.
  • 当該引用部分を,スタンドオフスタイル(訳注:20章を参照)で記録する.
  • 当該引用部分の境界を,空要素で示す.
これらに関する詳細は,20 非階層構造を参照のこと.
本節で紹介する最後の要素soCalledには,引用部分が,話者から距離を 置かれていることが記録される. 典型例として,例えば,新聞の見出しや広告でよく見かける,「い わゆる」の意味で付けられた引用符は,その真実味に疑いがあるこ とが示されている.
<head>PM dodges <soCalled>election threat</soCalled> in interview</head>
また,この要素は,皮肉を示すようなものも記録することができる. 例えば,以下のような場合である.
He hated <soCalled>good</soCalled> books.
<soCalled>Croissants</soCalled> indeed! toast not good enough for you?
Although Chomsky's decision that all NL
sentences are finite objects was never justified by arguments from
the attested properties of NLs, it did have a certain
<soCalled>social</soCalled> justification. It was commonly assumed in
works on logic until fairly recently that the notion
<mentioned>language</mentioned> is necessarily restricted to finite
strings.

3.3.4 用語,注釈語,同等語,解説

本節では,注釈語や,代替の用語や解説などの扱いについて紹介する.

専門用語は,一般に,初出時に,斜体または太字で示される. そのような用語への注釈は,引用符で示されることがある. 言語分析では,問題となる単語は,斜体で示され,その直後に,解 説が,一重引用符で示される. ある語句が,使われたのではなく,(例として)言及された場合は, 斜体または引用符で示され,この場合には,それが解説される ことは普通はない.
  • term 専門用語とされる単一語,複数語,記号表示を示す.
  • gloss 語句の説明や定義を示す.
これらの要素は,クラスmodel.emphのメンバーである.

要素termは,要素glossを選択的に伴うことで, 要素mentionedと同じものとして使うこと ができる. 要素glossが使われている時には,属性 targetに,解説の対象と案ル用語への リンクが記される. このリンクは, 要素term, または要素mentionedに,属性値xml:idを付与し, その属性値にある識別子を,要素glossにある属性targetの属性値として付与することで成立す る. 以下にある例では,この機能を使っている. この様な,TEI文書中におけるリンクに関する詳細は, 16 リンク,分割,統合にある.

例:
We may define <term xml:id="TDPvrend="sc">discoursal point of view</term>
as <gloss target="#TDPv">the relationship, expressed through discourse
structure, between the implied author or some other addresser,
and the fiction.</gloss>
<gloss rend="unmarkedtarget="#PRSR">A computational device that infers
structure from grammatical strings of words</gloss> is known as a
<term xml:id="PRSR">parser</term>, and much of the history of NLP over the
last 20 years has been occupied with the design of parsers.
There is thus a striking accentual difference between a verbal
form like <mentioned xml:id="cw234xml:lang="grc">eluthemen</mentioned>
<gloss target="#cw234">we were released,</gloss> accented on the
second syllable of the word, and its participial derivative
<mentioned xml:id="cw235xml:lang="grc">lutheis</mentioned>
<gloss target="#cw235">released,</gloss> accented on the last.
TEIで解説される対象としてある名称を記録する要素は,他にもある. 例えば,要素,属性,クラス(そして属性値も),グリフの解説などが ある.
  • altIdent 特定言語において,XMLの要素,クラス,属性などで推奨される名前を示す.
  • desc 当該要素,属性,属性値を採用した目的の簡単な解説を示す.
  • equiv 親要素と同等とされる構成要素を,相互参照または外部リンクで示す.
    uri 外部識別子によって親要素の意義を表す.
    filter 当該要素を標準的XMLデータに変形する外部スクリプトへの参照を示す.
    name 親要素の意義を表す.
これらの要素は,要素glossと共に,クラスmodel.glossLikeを構成して いる.
要素glossには,当該対象の名称が,その意 味が自明ではない時に,簡単な説明が記録される. 例えば,任意のテキストの単位で使うことができる要素abの定義を,以下のように示すことがで きる.
<elementSpec module="linkingident="ab">
 <gloss>anonymous block</gloss>
<!--... -->
</elementSpec>
要素glossは, 同じように,属性名または属性値の解説にも使うことができる.
<valList type="open">
 <valItem ident="susp">
  <gloss>suspension</gloss>
  <desc>the abbreviation provides the first letter(s)
     of the word or phrase, omitting the remainder.</desc>
 </valItem>
 <valItem ident="contr">
  <gloss>contraction</gloss>
  <desc>the abbreviation omits some letter(s) in the middle.</desc>
 </valItem>
<!--...-->
</valList>
ここでは,要素descとは,使い方が異なることに注意して欲 しい. 要素descは,当該対象物の,完全な解説を示すためのものである.
要素equivには, 当該要素で示されるものと,スキーマ上またはオントロジー上,同一 のものを示すとされる対象が記録される. 属性uriには,概念が定義されている所在 への参照が記録される. 例えば,TEIの要素deathには,CIDOCCRMのE69で定義されている 概念が記録されるが,このことを以下のように宣言することができる.
<elementSpec module="namesdatesident="death">
 <equiv name="E69uri="http://cidoc.ics.forth.gr/"/>
<!--... -->
</elementSpec>
要素equivでは,新たに定義され た要素が,TEI中にある要素と関連づけられている. この関連づけは,属性filterと属性nameで示される. TEIをカスタマイズする時に(23.2 Personalization and Customization), この機能は便利である. これにより,「手短に」定義を示し,データ登録が容易で,定義も読 みやすくなる. 例えば,要素boは,概念上, 規格上の書き方で「hi rend='bold'」と いう記述と同等であると,既に宣言されているとしよう. この様な環境の下で,以下のような宣言があるとすると,追加的な定 義として,要素boのインスタンスは, URIで示された属性filterによる変換処理を経ることで,TEIの規定に あるもと同等となり,要素名boldで処 理することが可能となる. また,属性mimeTypeは,フィルターとし て指定されている言語の種類(ここではXSL)を指定している.
<elementSpec ident="bons="http://www.example.org/ns/notTEI">
 <equiv
   filter="http://www.example.com/equiv-filter.xsl"
   mimeType="text/xsl"
   name="bold"/>

 <gloss>bold</gloss>
 <desc>contains a sequence of characters rendered in a bold face.</desc>
<!-- ... -->
</elementSpec>
要素altIdentは,当該対象の,別名を記録す る. 例えば,異なる言語での表現などである. 以下の例では,ドイツ語であるAbkürzungが,別名として指定されている.
<elementSpec ident="abbrmode="change">
 <altIdent xml:lang="de">Abkürzung</altIdent>
<!--...-->
</elementSpec>
同様に,以下では,要素graphicが本 来持つ属性urlが,異なる識別子hrefによって指定できることが記されている.
<elementSpec ident="graphicmode="change">
 <attList>
  <attDef mode="changeident="url">
   <altIdent>href</altIdent>
  </attDef>
<!-- .... -->
 </attList>
</elementSpec>

既定値では,要素altIdentのは,属性identの値と同一である.

要素descの 内容には,当該対象物の持つ機能の概要が記録される. この時,以下の例のように,引用の形式で,記述される.
<elementSpec module="coreident="foreign">
<!--...-->
 <desc>identifies a word or phrase as belonging to some language other
   than that of the surrounding text. </desc>
<!--...-->
</elementSpec>
便宜上,要素descの内容は,「含む」「示す」「規定する」 という動詞を含む述部記述になっている(訳注:これは英語しか念頭にない例).

3.3.5

簡単な例として,以下のような文を考えてみる.

On the one hand the Nibelungenlied is associated with the new rise of romance of twelfth-centuryFrance, the romans d'antiquité , the romances of Chrétien de Troyes, and the Germanadaptations of these works by Heinrich van Veldeke, Hartmann von Aue, and Wolfram von Eschenbach.

最初の文にある斜体で印刷されている句は,強調であることを記録 すると,例えば,以下のようになる.
On the one hand the <hi rend="italic">Nibelungenlied</hi> is
associated with the new rise of romance of twelfth-century France,
the <hi xml:lang="frrend="italic">romans d'antiquité</hi>,
the romances of Chrétien de Troyes, ...
但し,この例では,この部分が,斜体のタイトルなのか,斜体で示され た外国語なのかの区別が解らない. また,斜体で表示される句は,この他にもあるかもしれない. このままでは,(例えば)外国語を特定するための検索ソフトでは,この 様な斜体という情報だけからは,よい結果が得られないだろう. 経済上.知的管理上,もし可能であるならば,強調の機能とその表現方 法は,以下のように,分けて記録した方がよい.
On the one hand the <title rend="italic">Nibelungenlied</title>
is associated with the new rise of romance of twelfth-century France,
the <foreign rend="italic">romans d'antiquité</foreign>, the
romances of Chrétien de Troyes, ...
この例にある,強調が示すテキスト素性の弁別については,そう問題 にはならない. はっきりしない例として,例えば,以下にある斜体の例を考えてみる.

A pretty common case, I believe; in all vehement debatings. She says I am too witty; Anglicé, too pert; I, that she is too wise; that is to say, being likewise put into English, not so young as she has been: in short, she is grown so much into a mother, that she had forgotten she ever was a daughter. ...

この例において,vehementの斜体 と,not so young as she has beenの斜体は,明らかに異なるものである. 前者は強調のため,後者はよく使われる一節の為である. また,too wisetoo perttoo wittyには, 皮肉が込められている. これら解説の対象となる句は,専門用語でも,引用された語で もないが,引用句として扱われている. それは,作者が,その句が,主人公やその母に語らせているからであ る. 「mother」と 「daughter」が斜体で示されてい るのは,これらを対比させるためである. ここまでの解説で,これに相応しい分類はない. 「Anglicé」は,英語ではないと考 えられるが,斜体になっていないことに注意して欲しい.

これらを考慮した符号化の例は,以下のようになる.
A pretty common case, I believe; in all <emph>vehement</emph>
debatings. She says I am <q rend="italic">too witty</q>;
<foreign xml:lang="larend="roman">Anglicé</foreign>,
<gloss rend="italic">too pert</gloss>; I, that she is
<q rend="italic"> too wise</q>; that is to say, being likewise
put into English, <gloss rend="italic">not so young as she has
been</gloss>: in short, she is grown so much into a
<hi rend="italic">mother</hi>, that she had forgotten she ever
was a <hi rend="italic">daughter</hi>.

3.4 簡単な編集上の変更

印刷物を編集する際と同じく,電子テキストを編集する際にも,編 集の際に注釈をテキストに加えたり,当該テキストが変更されたこ とを示す必要があることもある. 本節では,この様な,編集の際に介入したことを記録するための要 素を解説する. 例えば,挿入された情報は,誰によってなされたのか,符号化する 人か,電子化の元資料となった印刷物の編集者か,それより以前の 編集者か,写本の筆写者か,などを示すためのものである.

本節で解説される要素は,ごく一般的な編集上の介入やコメントに ついてのみ対応するするものである. この他の,構造化されていないコメントについては, 3.8 注釈と索引にある 要素note で記録することになる. より構造化された解釈的注釈については, 16 リンク,分割,統合で解説されているよ うな,各種の手法で記録することが可能である. 本節で紹介する用例では,ごく簡単な編集上の介入を扱っている. 特に,短いテキスト部分に異なる読みが可能である場合の,簡単な 符号化の方法を紹介する. あるテキストの広範囲で散在し,多くの解釈を符号化する必要があ る場合には,16 リンク,分割,統合で紹介する仕組みを 使うべきである. あるテキスト部分の実現形が複数ある場合, 12 校本で紹介する, 校本向けの仕組みを使うことができる.

本節で解説される要素の殆どは,符号化する人が「責任」に関する 情報と,「確信度」に関する情報を記録したいときに使われるもの である. 責任とは,当該の編集上の介入に責任を持つ人物または団体を示す ことである. 確信度とは,当該の編集上の介入に関する程度を示すものである. 本節では,これらの利用に向けた解説をする. 使われる要素は,クラスatt.editLikeのメンバーに なる. このクラスのメンバーは,全て以下の属性を選択的に取ることがで きる.
  • att.editLike 学術的調整・解釈の性質を表す属性を示す.
    cert 当該解釈や調整の確信度を示す.
    resp 当該解釈や調整の責任者を示す.例えば,編集者,翻訳者など.
    evidence 当該解釈や調整の信頼度や正確さを判断する証拠を示す.
本節で紹介する要素の多くは,2つの使い方が可能である. ひとつは,要素内容として記録されるテキストが,当該要素が定義 する,編集上の介入の種類を示す方法である. また,この要素を,特別な要素choiceを使い,まとめるという使い方もで きる.
  • choice テキスト中の同じ場所で,異なる符号化記述をまとめる.
この要素を使い,元資料にある姿のままあるテキストと,複数の編 集された姿を,同時に符号化することができる. これにより,ソフトウェアが,テキストの表示を自動的に変えるこ とが可能となる. 例えば,スタイルシートにより,元資料上の表示にするのか,編集 上の介入を経た後の表示にするのかを切り替えることができるよう になる.

この様にまとめて使うことができる要素は,クラス model.choicePartのメ ンバーである. このクラスのメンバーには,要素 siccorrregorigunclearadddel がある. これら要素の機能や使い方は,以下で解説する.

本節では,編集上の介入として,以下の3種類の扱う.
  • 明らかな間違いを指摘または修正.
  • 異形態,不規則形,一般的でない形,変わった形を指摘または 正規化.
  • 編集上の追加,一部修正,削除.

転記や編集の際に使われる要素の,より詳細な解説は, 11 Representation of Primary Sourcesにある.

3.4.1 明らかな間違い

元資料にあるテキストが明らかに間違っているとき,符号化する 人やまたは転記する人は,コメントを付けずにそれを修正するこ とがある. しかし,学術資料としては,そのような修正や,元資料上の状態 が記録されていると,便利である. 本節で解説される要素は,全て,上記の3つの手法が可能であり, 3番目の手法により,ソフトウェアは,元の形態または修正後の 形態を,選択することが容易にできる.
  • sic 明らかに間違い,不正確ではあるが,そのまま収録してあるテキスト.
  • corr 元資料中の明らかな間違いを正したものを示す.
以下にある例では,ひとつの素材を複数の手法で扱うものである. 元資料は,以下のようになっている.

Another property of computer-assisted historicalresearch is that data modelling must permit any one textual feature orpart of a textual feature to be a part of more than one informationmodel and to allow the researcher to draw on several such modelssimultaneously, for example, to select from a machine-readable textthose marginal comments which indicate that the date's mentioned in themain body of the text are incorrect.

符号化する人は,印刷上の間違いを,何も言わずに,または,そ れを以下のように明示した上で,修正することができる.
… marginal comments which indicate that the <corr>dates</corr>
mentioned in the main body of the text are incorrect.
または,符号化する人は,単に,印字上の間違いを,修正すること なくそのまま符号化することも可能である. その際,コメントは付けずに済ませたり,要素sicを使い, 転記されたテキストにある間違いは,符号化の際に生じた間違いで はないことを示すことができる.
… marginal comments which indicate that the <sic>date's</sic>
mentioned in the main body of the text are incorrect.
符号化する人が,元資料にあるテキストを符号化し,同時に,検索の ことも考えて,間違いを修正したい場合には,要素 sicと要素corrを,要素choiceでまとめることで,同時に 使うことができる.
… marginal comments which indicate that the
<choice>
 <corr>dates</corr>
 <sic>date's</sic>
</choice> mentioned in the main body of the text are
incorrect.
要素sicと要素 corrの出現順番 は,問題にならない.
当該修正に責任ある人物や版を明示したいときには,以下のよう に記録することができる.
… marginal comments which indicate that the
<choice>
 <corr resp="#msm">dates</corr>
 <sic>date's</sic>
</choice> mentioned in the main body of the text are
incorrect.
<!-- within the header for this document ... -->
<respStmt>
 <resp>editor</resp>
 <name xml:id="msm">C.M. Sperberg McQueen</name>
</respStmt>
この例にある属性respには,当該修正の責任 に関する情報が記録されている. この属性値(すなわち#msm)は,3.6 簡単なリンクと相互参 照で解説するpointerの値となっている. 例えば,この例では,TEIヘダー内にある要素nameを参照してい る. これは,TEI内の要素に限らず,例えば,当該修正箇所が,他の資料を元 にしたものである場合には,(13 名前,日付,人物,場所にあるモジュールが組み 込まれている場合には)要素personや, 3.11 書誌項目の記述または参照で解説されている,書誌情報を 記録する要素を示すことも可能である. 属性respは,クラスatt.editLikeの全てのメンバーで取 ることができる. また,このクラスのメンバーは,属性certを 取ることも可能で,以下の例にあるように,その値には,特定の修正箇所 に対する,編集上の確信度を記録することができる.
An <choice>
 <corr cert="high">Autumn</corr>
 <sic>Antony</sic>
</choice> it was,
That grew the more by reaping
これについての詳細は,11.3.3 Correction and Conjectureを参照のこと.

この例のように,元のテキストにはない修正が付加されている場合, それは要素corrに記録されるべきである. また,当該修正が,元資料に既に含まれており,そこには追加・修正 の痕跡が読み取れる場合には,それらを要素addや要素 delで記録す べきである. これらの詳細は,3.4.3 追加,削除,省略にあ る. 当該修正は,編集上付加されたもので,元資料には,物理的な損傷ま たは読み取れない理由から存在していない場合には,要素supplied で記録することができる. 当該修正が,省略語を省略なしへと変更しただけのものであれば,要 素exで記録す ることができる. このような,著者や筆写者の仕事に対して,編集の過程で何らかの介 入をしたことを記録する要素については, 11 Representation of Primary Sources に詳しく解説してある.

3.4.2 正規化

符号化する元資料に,一般的ではない綴りなどの異形が多く使われ ている場合には,様々な理由から,それを「正規化」したい時があ る. つまり,そのような異形を,それと同等とされる「規格」「正規」 形へと書き換えるのである. 11

元資料のテキストを変更する他の場合と同様に,そのような変更は, コメントなくされること可能であるし(TEIヘダーには,そのような コメントなしで修正する種類を記録すべきである),以下にある要 素を使い,明示的に変更することも可能である.
  • reg 正規化された読みを示す.
  • orig 正規化または校正は施されていない,元の形のまま符号化されている読みを示す.
  • choice テキスト中の同じ場所で,異なる符号化記述をまとめる.

これらの要素にある情報を使うソフトとしては,例えば,初心者や 学習者向けのもの,綴りの違いは問題とならない言語研究,綴り辞 典などが考えられる.

例えば,16世紀のテキストを考えてみる.

how godly a dede it is to overthrowe so wicked a racethe world may judge: for my part I thinke there canotbe a greater sacryfice to God.

符号化する人が,当該テキストにある元の綴りを記録する際に,そ れが一般とは違うことをだけを記録できればよいと考えるときには, 要素origを属性なしで,例えば以下のように使 うことができる.
<p>...how godly a <orig>dede</orig> it is to
<orig>overthrowe</orig> so wicked a race the
world may judge: for my part I <orig>thinke</orig>
there <orig>canot</orig> be a greater
<orig>sacryfice</orig> to God</p>
また,符号化する人が,ある単語が現代風に変更されていることを 示すときには,要素regを属性なしで,例えば以下のように使う ことも可能である.
<p>...how godly a<reg>deed</reg> it is to
<reg>overthrow</reg> so wicked a race the
world may judge: for my part I <reg>think</reg>
there <reg>cannot</reg> be a greater
<reg>sacrifice</reg> to God.</p>
また,符号化する人が,新旧両方の綴りを記録しておきたい場合, (例えば)同じ電子テキストでも,その元資料が旧版または新版のどち らを元にしたのかを示したい場合もあるだろう.
<p>...how godly a <choice>
  <orig>dede</orig>
  <reg>deed</reg>
 </choice> it is to
<choice>
  <orig>overthrowe</orig>
  <reg>overthrow</reg>
 </choice> so wicked a race the
world may judge: for my part I <choice>
  <orig>thinke</orig>
  <reg>think</reg>
 </choice>
there <choice>
  <orig>canot</orig>
  <reg>cannot</reg>
 </choice> be a greater
<choice>
  <orig>sacryfice</orig>
  <reg>sacrifice</reg>
 </choice> to God.</p>
属性respは,当該正規化に責任を持つ団 体を特定するために使うことができる. 例えば,古ノルド語の詩の第1連にあるGrógaldrにおいて, 元の写本にあるduraという語形が, 現代版では,dyradoorsへと正規化されている. 例えば,写本にある‘vek ekþik dauðra dura’は,以下のように,元 の形と,正規化されたものと同時に記録することができる.
vek ek þik dauðra
<choice>
 <orig>dura</orig>
 <reg resp="#MSM">dyra</reg>
</choice>

3.4.3 追加,削除,省略

以下にある要素は,語句が省略されている,加えられている,削除 記号が付けられているなどを記録するものである. 編集向けの他の要素と同様に,ここにある要素は,広く編集の際に 使うことができる.
  • gap TEIヘダーにある編集上の理由,または当該資料が判読できな い・聞こえな いことを理由に,転記の際に省略された部分の 場所を示す.
    reason 省略の理由を示す.例えば, 見本, 聞こえない, 無関 係, 取り消し, 取り消しがありかつ判読できない,など.
  • unclear 元資料からは判読できないまたは聞こえないという理由で,確実に転記でき ない語句や一節を示す. reason
    当該資料から転記が困難である理由を示す.
  • add 著者,筆写者,注釈者,校正者による,文字,単語,句レベルでのテキスト 挿入を示す.
  • del 著者・筆写者・注釈者・校正者により,削除または削除として符号化または 余分なものまたは間違いとして示されている,文字,単語,句を示す.
符号化する人は,元資料にあるテキストの一部を省略することも可 能である. 例えば,読めなかったり,転記が不可能であったり,編集方針上の 詩や散文の符号化を中止するという場合である. この種の編集上の決断に関する詳細は,TEIヘダーに記録されるべ きである(2.3 符号化解説を参 照). 省略がある場所は,要素gapで示されるべきである. また,その省略に関する情報,例えば,理由,程度,その責任者や 団体などを記録する場合には,以下のようにすることができる.
<gap reason="illegibleunit="wordsextent="2"/>
<gap reason="overwriting illegibleextent="8unit="chars"/>
要素descは, 当該省略されたものを解説したい場合に使うことができる.
<gap reason="samplingextent="120unit="lines">
 <desc>irrelevant commentary</desc>
</gap>
… Their arrangement with respect to Jupiter and to each other was as follows:
<gap reason="samplingextent="2unit="cm">
 <desc>astrological figure</desc>
</gap>
That is, there were two stars on the easterly side and one to the west; …

要素addと要素delは,語句が追加・削除されている場所を 示すために使われる. 但し,この2つの要素は,いくつもの要素をまたぐような,長めの部 分に使うのは,適切ではない. そのような場合には,11.3.4 Additions and Deletionsで解説する 要素addSpan と要素delSpanを使うことになる.

テキストを追加する理由は様々である. そのような追加テキストは,元のテキストとは明確に分けて記録され ることになる. 例えば,括弧で括られたり,行上付で示されたりする. 例えば,19世紀の写本を例に取ると,以下のようになる.
The story I am going to relate is true as to its main facts,
and as to the consequences <add place="supralinear">of
these facts</add> from which this tale takes its title.

要素addは,編集上の変更を示すためには使うべきでは ない. 例えば,元テキストでは間違いのために省略されているものを編集上 補完したものや,別の版には存在する一節を付加したような変更が, これに該当する. この様な追加には,要素corrまたは要素supplied を使うべきである. この詳細は,それぞれ3.4.1 明らかな間違い11.3.3 Correction and Conjectureで解説してある.

要素unclearは,元資料にある一節が,確信を持っ ては読めない場所,または転記者が何らかの理由で確信を持てない場 所を記録するために使われる. 例えば,部分的に聞こえなかったり,読めなかったりする場合である. 属性reasonと属性respは,要素gapと共に使われて,この様な不確実な理由 や,読みを推測した責任者を記録することができる.

例えば,以下のようになる.
<l>And where the sandy mountain Fenwick scald</l>
<l>
 <unclear reason="ink blot">The</unclear> sea between
yet hence his pray'r prevail'd
</l>
以下の例は,発話テキストの例である.
<p>... and then <unclear reason="passing truck">marbled queen</unclear>...</p>

全く読めない・聞き取れないような場合には,先述の要素gapを使うべき である.

要素delは,元の資料で消された後がありながら,まだ それがある程度の確信を持って読み取れるようなものを記録するため に使われる. これは,符号化する人や転記者が,全く読めない等の理由から省略さ れているものとは,異なるものである. この様な部分は,印刷物においても,ユーモアを示すものとして,使 われることがあるが,とりわけ手書き資料の場合には,重要になって くる.
<l>One day I will sojourn to your shores</l>
<l>I live in the middle of England</l>
<l>But!</l>
<l>Norway! My soul resides in your watery
<del type="overstrike">fiords fyords fiiords</del>
</l>
<l>Inlets.</l>
属性typeは,版本・写本において,複数 の削除の方法を区別するために使われる. 例えば,エリオットのWaste Landの版 本を例にとったものが,以下である.
<l>
 <del type="overtyped">Mein</del> Frisch
<del type="overstrike">schwebt</del> weht der Wind
</l>
版本・写本に見られる削除は,追加を伴うことが多い.
<l>
 <del type="overstrike">Inviolable</del>
 <add place="infralinear">Inexplicable</add>
splendour of Corinthian white and gold
</l>
11.3.5 Substitutionsで解説される要素substには, この種の追加や削除がまとめて記録される.

要素delは,元資料の当該部分が,確信を持っては読め ない,または全く読めない部分や,転記者や編集者が何らかの理由で 省略したような部分には使うべきではない. 確信を持っては読めない部分は,要素unclearに 属性reasonを伴い,その困難な理由と共 に,記録されるべきである. 転記者や編集者が省略した部分は,要素gapで示すことができる.

3.5 名前,数値,日付,略語,住所

本節では,周囲のテキストからは区別した方が便利なテキスト素性に ついて解説する. とりわけ,名前,日付,数値は,データベースの情報となる場合に は,研究者にとって重要となる. これらを周囲のテキストとは区別しておくことは,語彙に関心を持 つ研究者にとっても重要である.

本節では,このようなテキスト素性の全ては解説されない. 名前,数値,計測値,日付などについては,名前モジュールで扱わ れる(13 名前,日付,人物,場所を参照).

3.5.1 参照文字

「参照文字(列)」とは,人物や場所などを参照する句のことであ る. 参照文字(列)を記録する要素には2つある.
  • rs 一般的な意味での名前や参照文字列.
  • name 固有名詞.
必要の際には,属性typeを使い,当 該参照対象の種類を特定することもできる.
例:
<p>
 <q>My dear
 <rs type="person">Mr. Bennet</rs>
 </q>, said his lady to
him one day, <q>have you heard that <rs type="place">Netherfield Park</rs> is let at last?</q>
</p>
<p>Collectors of water-rents were appointed by the
<rs type="organization">Watering Committee</rs>.
They were paid a commission not exceeding four per
cent, and gave bond.</p>
<p>It being one of the principles of the
<rs type="org">Circumlocution Office</rs> never, on any
account whatsoever, to give a straightforward answer,
<rs type="person">Mr Barnacle</rs> said, <q>Possibly.</q>
</p>
以下の例のように,要素rsが参照するものは,固有名詞だけに限ら ず,人物や場所などへの参照も可能である.
<p>
 <q>My dear <rs type="person">Mr. Bennet</rs>
 </q>, said
<rs type="person">his lady</rs> to him one day ...
</p>
一方,要素nameは,固有名詞を構成する文字列のみを参 照するために使われる. この要素は,要素rsと同じく使うことが可能である. また,要素rsの中で使うことも可能である. 例えば,普通名詞と固有名詞が混在する文字列を参照するときである. 以下は,Pride and Prejudiceの一節を符号化する,ひとつの例である.
<p>
 <q>My dear <name type="person">Mr. Bennet</name>,</q> said <rs type="person">his lady</rs> to him one day,
<q>have you heard that <name type="place">Netherfield Park</name> is let at last?</q>
</p>
また,以下の例のように,固有名詞を,参照文字列の中に埋め込むことも 可能である.
<rs>His Excellency the Life President, <name>Ngwazi Dr H. Kamuzu Banda</name>
</rs>

名前としてタグ付けしただけでは,個人の名前を,参照を目的とした 規範名へと変換する際に,十分とはいえない. 当該テキスト中にある名前は,綴りは必ずしも同じではなく,部分的 であったり,曖昧だったりすることがある. また,名前には接辞,例えば,van とかdelaが付くこともあり,これ らは,参照形の一部としてあることもある. これらは,言語や国に依存するものである.

ここで,2つの問題を提示しよう. ひとつは,元資料にある形とは異なる,正規化された名前を使うべき だろうか. もうひとつは,正規化されていることとは無関係に,当該の名前が示 す人物や場所などを特定すべきだろうか. 3.4.2 正規化で紹介さ れている要素regは,前者の問題に対応する要素である. また,属性keyは,後者の問題に対応する 属性である.

属性keyは,クラスatt.namingのメンバーで使うこと ができる.
  • att.naming 名前,人物,場所,組織を示す要素に付与される属性を示す.
    key 名前で特定できる実体の名前を示す.例えばデータベース におけるレコードのキーなどのトークン.
属性keyの目的は,文書中の散見する,同じ人物や場所への参照をま とめることにある.
<p>
 <q>My dear <rs key="BENM1type="person"> Mr. Bennet</rs>,</q>
said <rs key="BENM2type="person">his lady</rs> to him one day,
<q>have you heard that <rs key="NETP1type="place">Netherfield
     Park</rs> is let at last?</q>
</p>
<p>
 <name key="VOM1type="person">Mme. de Volanges</name> marie <rs key="VOM2">sa fille</rs>: c'est encore un secret;
mais elle m'en a fait part hier.
</p>

属性keyの属性値は,上例のように,簡略 化されたコードとしても使うことができる. また,もう少し便利なことは,当該要素により名前が付与されたエン ティティについての情報を提供する他の資料を参照することである. そこには,当該エンティティ向けの多様な名前を記録することができ る.

この様な使い方と,入れ子かされた要素regとは,使い 方を区別すべきである. 要素regは,この例では,参照文字列の一般的な形を示すために使わ れている.
<p>My personal life during
the administration of <rs key="POJA1type="person">Col. Polk
   (<reg>Polk, James K.</reg>)</rs> has but poorly compensated me for the
suspended enjoyments and pursuits of private and professional
spheres</p>
3.4 簡単な編集上の変更で解説する,要素choiceは,一般的な名前の形と,元資料 中で使われている名前の形の両方を記録するときに使うことになる.
<p>
 <name key="WADLM1type="person">
  <choice>
   <sic>Walter de la Mare</sic>
   <reg>de la Mare, Walter</reg>
  </choice>
 </name>
was born at <name key="Ch1type="place">Charlton</name>, in
<name key="KT1type="county">Kent</name>, in 1873.
</p>
3.8.2 索引で解説する,要素indexは, 正規化された名前が,不変の指標となっている場合に,それを記録す るものである.
<p>
 <name type="place">Montaillou</name> is not a large parish.
At the time of the events which led to
<name type="person">Fournier<index>
   <term>Benedict XII, Pope of Avignon (Jacques Fournier)</term>
  </index>
 </name>'s
investigations, the local population consisted of between 200 and 250 inhabitants.
</p>
多くのソフトウェアでは,これまでの手法で十分ではあるが,場合によっ ては,2つの不足点がある. 当該名前が多数使われている場合には,その正規形を何度も繰り返して使 う必要がある. また,タグを付加する作業自体が,対象を処理することを面倒で,難しく することがある. 人物や地名に特化したソフトウェアや,名前の構成部分を分析するソフト ウェアには,13 名前,日付,人物,場所で解説する要素や, 18 素性構造にある分析向けの手法を使うべきである.

3.5.2 住所

本ガイドラインでは,郵便アドレスと電子メールアドレス用に,以 下の要素を用意している.
  • address 郵便配達情報を示す.例えば,出版者,組織,個人の住所など.
  • email eメールを届けるeメールアドレスを示す.
この2つの要素は,クラスmodel.addressLikeのメンバーである. もし,アドレスに関して他の種類の要素を追加したい時には,この クラスを拡張することができる.
本ガイドラインでは,メールアドレスの下位構造(例えば,ドメイ ン部分とローカル部分)や,個人のアドレスと,架空のアドレスに ついては,特に提案は用意していない.
<email>editors@tei-c.org</email>
郵便用のアドレスを符号化する一番簡単な方法は,書かれているよう に,行を単位として記録することである. 以下の要素は,この用途に使うことができる.
  • addrLine 住所情報を記述する行を示す.
例えば,以下のようになる.
<address>
 <addrLine>110 Southmoor Road,</addrLine>
 <addrLine>Oxford OX2 6RB,</addrLine>
 <addrLine>UK</addrLine>
</address>
または,住所を,意味的な要素を使うことで,符号化することも可能 である. クラスmodel.addrPartには, そのような用途向けの要素が定義されている.
  • street 住所情報としての,通りを表す完全情報を示す.建物の名前や番号,通りの 名前など.
  • name 固有名詞.
    type 当該テキストで名付けられた対象の種類を示す.
  • postCode 郵便の配達や区分けを簡単にするための,郵便の宛名情報の部分となる数値 または文字を含む.
  • postBox 郵便配達で識別子となる,通り名以外の,数値などを示す.
  • model.nameLike 人物,場所,団体に名前を付与する,または参照する要素をまとめる.
  • model.persNamePart 個人名の部分を構成する要素をまとめる.
  • model.placeNamePart 場所名の部分となる要素をまとめる.
住所の情報として,クラスmodel.addrPartのメンバーは, どの順番でも,使われる回数にも,制限がない. また,必ず使う必要もない.

住所を示す為の,短い略記号(例えば,地域や州を示すもの)が使われ ている場合には,その正式な名前を,当該要素の内容に記録した方が よい. 但し,その略記号は,グローバル属性nに 記録しておいた方がよい. それにより,(例えば),それ用のラベルを用意してあるソフトウェア が,必要な情報をそこから見いだすことができるようになる. 住所を構成する他の構成要素は,一般的な用途向けの要素nameを使い, 記録することも可能である. または,(名前モジュールが導入されているのであれば)より名前に特化した 要素を使うことも可能である.

コアモジュールで定義されている要素を使うのであれば,例えば,以 下のように符号化することができる.
<address>
 <street>110 Southmoor Road</street>
 <name type="city">Oxford</name>
 <postCode>OX2 6RB</postCode>
 <name type="country">United Kingdom</name>
</address>
住所にある要素をどの順番で記録するかは,文化によって異なること から,その順番に制約はない.
<address>
 <name type="org">Università di Bologna</name>
 <name type="country">Italy</name>
 <postCode>40126</postCode>
 <name type="city">Bologna</name>
 <street>via Marsala 24</street>
</address>

地名の正規化については,3.5 名前,数値,日付,略語,住所(訳注: 13 名前,日付,人物,場所の間違いだ ろう)を参照のこと. 郵便用アドレスには,上記にある,一般的な用途向けの要素 nameで示されている名前が含まれること もある.

13 名前,日付,人物,場所で解説される,名前モ ジュールを導入する場合には,クラスmodel.addrPartのメンバーである, より特化した要素,例えば,要素countryや,要素settlementを使うことができる. 例えば,先の例も,以下のように符号化することができる.
<address>
 <street>110 Southmoor Road</street>
 <settlement>Oxford</settlement>
 <postCode>OX2 6RB</postCode>
 <country>United Kingdom</country>
</address>

3.5.3 数値や計測値

本節では,数値や計測値を記録するための要素と,これらの要素を 使った方がよいと思われるケースを紹介する. 数値や計測値を記録する句レベルの要素として,以下のものがある.
  • num 各種形式による数値を示す.
    type 数値の種類を示す.
    value 標準的な形式で数値を示す.
  • measure ある対象や商品の大きさを表す語句を示す.一般には,数値, 単位,商品名を含む.
    type 当該計測種類を示す.
  • measureGrp 大きさに関する規格を示す.例えば,手書き資料のページの高さや幅などを 示すためのもの.

名前や略語と同様に,数値はテキスト中の至る所で使われる. 数値は,文字と数字で記録される(例えば, twenty-onexxi21など). また,これらの表現は,言語により異なる(例えば, 英語では「5th」と書き,ギリシャ語 では「5.」と書く. また,英語では, 「123,456.78」と表記するものが, フランス語では「123.456,78」と表 記される).

また,多くのソフトウェア,例えば,自然言語処理や自動翻訳にお いては,数値は,テキスト中にある他の「単語」とは同じく見なされない. そのような用途向けに,要素numがあり,これにより,周囲のテキ ストと数値を分けることができる. また,あるソフトウェアにおいては,正規化された数値を必要とす るかもしれない この場合には,要素numを使い,正規化された数値を記録する ことができる.

例えば,以下のようになる.
<num value="33">xxxiii</num>
<num type="cardinalvalue="21">twenty-one</num>
<num type="percentagevalue="10">ten percent</num>
<num type="percentagevalue="10">10%</num>
<num type="ordinalvalue="5">5th</num>
<num type="fractionvalue="0.5">one half</num>
<num type="fractionvalue="0.5">1/2</num>

計測値は,詳細に表現される時には,数値や,計測単位を示す語句や, 計測される対象を示す語句などから構成される. これら全てが必要になるとは限らない. 但し,これらを,周囲のテキストからは分けておくことには,2つの 利点がある. まず,計測値は,符号化する人にとっては,単語としては認定できな い,簡略化された特定の表記方法や表記システムが使われることがある. そして,数量を扱うソフトウェアでは,それらの計測値を,計算する ために,内部の構成要素を分離・正規化することがある.

例として,まず,以下にあるセリアのお守り人形(Celia's charms)の リストを考えてみる. 符号化する人は,いくつかの計測値を記録している.
<div n="2">
 <list type="gloss">
  <label>Age</label>
  <item>Unimportant</item>
  <label>Head</label>
  <item>Small and round</item>
  <label>Eyes</label>
  <item>Green</item>
  <label>Complexion</label>
  <item>White</item>
  <label>Hair</label>
  <item>yellow</item>
  <label>Features</label>
  <item>Mobile</item>
  <label>Neck</label>
  <item>
   <measure>13¾"</measure>
  </item>
  <label>Upper arm</label>
  <item>
   <measure>11"</measure>
  </item>
<!--...-->
 </list>
<!-- ... -->
</div>
同様に,単語と誤解されるおそれのある,通貨を示すためにも,使うこと ができる.
<p>...the sum of
<measure type="currency">12s 6d</measure>...</p>
普通,計測値の正規化には,計測量,単位,計測対象の3つのうち,1つ以上 について,規格が必要となる. これらの値は,それぞれ,クラスatt.measurementで定義された 属性quantityunitcommodityで記録される.
  • att.measurement 正規化単位を表す属性を示す.
    quantity 計測単位の数を示す.
    unit 一般には標準記号により,計測単位を示す.
    commodity 計測される対象を示す.
これらの属性を使い,例えば,先のセリアのお守り人形にある「neck」 は,以下のように正規化した形で記録することができる.
<measure quantity="13.75unit="in">13¾"</measure>
このような符号化方法は,とりわけ,目録上にある歴史的なデータを表示 する際には有効である.
<list>
 <item>
  <measure
    type="volume"
    quantity="2"
    unit="bag"
    commodity="hops">
ii bags hops </measure>
 </item>
 <item>
  <measure
    type="volume"
    quantity="6"
    unit="truss"
    commodity="cloth">
six trusses Woolen and linen goods </measure>
 </item>
 <item>
  <measure
    type="weight"
    quantity="5"
    unit="ton"
    commodity="coal">
5 tonnes coale
  </measure>
 </item>
</list>
要素measureGrpは, 複数の次元(例えば,高さや幅)が必要であるとき,計測に関連する複 数の要素をまとめるために使うことができる. また,正規化された属性の繰り返しを避けるためにも使うことができ る.
<measureGrp type="volumeunit="in">
 <measure type="heightquantity="14">xiv</measure>
 <measure type="widthquantity="5">v</measure>
 <measure type="depthquantity="10">x</measure>
</measureGrp>

3.5.4 日付や時間

日付や時間は,数値と同様に,文化や言語により,様々な形態をと り,従って,言語処理の時と似た問題を引き起こすことになる. 日付や時間向けの要素は,クラスmodel.dateLikeに用意され ている. そのメンバーには,以下のものがある.
  • date 日付を示す.
    calendar 当該日付の歴システムを示す.
  • time 時間を表す語句を示す.
これらの要素には,クラスatt.datableやクラス att.durationにある属性を とることができる. この2つのクラスは,それぞれ,クラスatt.datable.w3cとクラス att.duration.w3cのメ ンバーである. その中でも,ここでは,属性whenにつ いて解説する.
  • att.datable.w3c W3Cに従い,時間事象の正規化方法を示す属性を示す.
    when 日付や時間を,標準形式で示す.

日付は,テキスト中の至る所で出現するが,ある場面(例えば,書 誌情報)においては,それを符号買うすることが推奨または必須と なる. 時間も,至る所で出現するが,その符号化は,一般には選択的であ る.

部分的な日付または時間情報(例えば 1990年1990年9月12時ごろなど)は, 属性valueに記録することができる. 厳密ではない日付や時間情報(例えば,8月上旬10時と12時の間)は, 時間幅として記録することができる. 時間幅の一端が明らかである時(例えば, 12:30前ハロウィンから数日後)には, 属性exactを使い,それを記録すること ができる.

日付や時間について,その正確さではなく,その確信度が問題とな る場合には,符号化する人はその事実を,21 確信度・責任にある仕組みを使い記録すべき である.

これらの仕組みは,確信のある日付や時間情報を詳細に記録する際 に,便利である. 日付や時間情報の一部分を符号化する時や,時間表現をより詳細に 分析する時には,本節で紹介する簡単な仕組みよりも, 13 名前,日付,人物,場所で解説する仕組みを使うべきである.

属性valueは,色々な形式で記された日 付や時間を,正規化したり曖昧さをなくす時に使うと,便利である. 例えば,以下のようになる.
<date when="1980-02-12">12/2/1980</date>
Given on the <date when="1977-06-12">Twelfth Day of June
in the Year of Our Lord One Thousand Nine Hundred and
Seventy-seven of the Republic the Two Hundredth and first
and of the University the Eighty-Sixth.</date>
属性valueは,要素dateの内容と 同様に,正規化された日付表現を示すことになる. その際,使用されるデータ形式は,W3C Schemaのデータ型であるべきである. 12 例えば,以下のようになる.
<date when="2001">The
year 2001</date>
<date when="2001-09">September 2001</date>
<date when="2001-09-11">11 Sept 01</date>
<date when="--09-11">9/11</date>
<date when="--09">September</date>
<date when="---11">Eleventh of the month</date>
<time when="08:48:00">8:48</time>
<date when="2001-09-11T12:48:00">Sept 11th, 12 minutes before 9 am</date>
ここにある最後の例では,正規化された表現は,時間を含む開始日を示し ている. 従って,属性timeを併用した記述と同等になる.
以下の例では,属性dateを使い,時間の幅を記録している.
<p>Those five years —
<date from="1918to="1923">1918 to 1923</date>
— had been, he suspected,
somehow very important.</p>
<p>The Eddic poems are preserved in a unique
manuscript (Codex Regius 2365) from <date notBefore="1250notAfter="1300">the second half of the thirteenth
century</date>, and <title>Hervarar
saga</title> dates from <date when="1300">around 1300</date>.</p>

属性calendarは,どの暦システムにおい ても,日付を記録するために使うことができる. もし属性valueに値が付与されている場合 には,それはグレゴリオ暦の日付と解釈すべきである.

3.5.5 略語

時には,元資料にある省略表現に対して,何らかの処理を施したり, それを正式形に伸張展開したり,または別のものに展開したりする こと,マークアップして起きたいことがある. 省略は,あるがままに,または,それを補って転記されることがで きる. このような状況は,以下にある要素で記録することも可能である.
  • abbr 名称の省略
  • expan 省略形の元の表現を示す.
要素abbrは,頭字語や専門用語を記すた めに使われる.
We can sum up the above discussion as follows: the identity of a
<abbr>CC</abbr> is defined by that calibration of values which
motivates the elements of its <abbr>GSP</abbr>; ...
Every manufacturer of <abbr>3GL</abbr> or <abbr>4GL</abbr>
languages is currently nailing on <abbr>OOP</abbr> extensions.
属性typeは,その省略形の機能を示すた めに使われる.
<abbr type="title">Dr.</abbr><abbr type="initial">M.</abbr> Deegan is
the Director of the <abbr type="acronym">CTI</abbr> Centre for Textual Studies.
Dr. M.のような省略は, 上例のように,2つの省略形とも,または1つの省略形とも扱うことが できる.
<abbr>Dr. M.</abbr> Deegan is
the Director of the <abbr>CTI</abbr> Centre for Textual Studies.
要素expanは,省略が, 編集スタイルや編集方針上,符号化するひとにより,展開されたこと を暗に示している. この場合には,省略形も記録されるべきである. 一般的には,要素choice中にある要素abbrにより,省略形とその展開形の両方が記 録される.
the
<choice>
 <expan>World Wide Web Consortium</expan>
 <abbr>W3C</abbr>
</choice>
入れ子化された省略形も,この手法で記録することができる.
<choice>
 <abbr>RELAXNG</abbr>
 <expan>regular
   language for <choice>
   <abbr>XML</abbr>
   <expan>extensible markup
       language</expan>
  </choice>, next
   generation</expan>
</choice>

省略形は,とりわけ写本やその他の元資料においては,重要な素性と なる. 省略形の転記には,本節で解説した,簡単な要素を使うよりも,より 細かな取り扱いが求められる. この詳細については,11.3 Altered, Corrected, and Erroneous Textsで解説する. そこでは,転記モジュールで使われる要素が解説されている.

3.6 簡単なリンクと相互参照

相互参照,すなわち文書中のある場所から他の複数の場所へのリン クは,本節で解説する,要素ptrと要素ref で符号化することができる. この2つの要素は共に,この要素が出現する文書中の場所から,他 の場所(時に複数の場所)を「指示する」ことになる. それらの場所は,属性targetで示され る. リンクを表現する仕組みは,他にもいくつかあり,その詳細は,16 リンク,分割,統合にあ る.

属性targetの値は,W3Cで規格化された XPointerという仕組みを取り,他の要素を参照する. これにより,参照先にある要素の属性xml:idの値を参照するといった,簡単な参照 から,XPointerを伴ったURIによる参照まで,幅広い参照方法を使 うことができる. 例えば,以下のようになる.
<p>For an introduction to the use of links in general, see <ptr target="#SA"/>;
for the complete XPointer specification, see
<ptr target="http://www.w3.org/TR/xptr-framework/"/>,
<ptr target="http://www.w3.org/TR/xptr-element/"/>,
<ptr target="http://www.w3.org/TR/xptr-xmlns/"/>, and
<ptr target="http://www.w3.org/TR/xptr-xpointer/#xpointer(id('chum')/quote)"/>;
for a discussion of TEI schemes for XPointer, see
<ptr target="#SATS"/>.</p>
明示的にリンクが符号化されいないが,相互参照として記録する必要が ある場合には,要素refを属性targetな しで使うことができる.

一般的なリンクに関する解説は,16 リンク,分割,統合を参照のこと. XPointerの詳細な解説は, http://www.w3.org/TR/xptr-framework/や, http://www.w3.org/TR/xptr-element/http://www.w3.org/TR/xptr-xmlns/ http://www.w3.org/TR/xptr-xpointer/#xpointer(id('chum')/quote) を参照のこと. XPointerとTEIスキームとの関連については, 16.2.4 TEI XPointer Schemesを参照のこと.

  • ptr/ 他の場所を示すポインターを定義する.
    target 当該ポインタの参照場所を,ひとつ以上のURIで示す.
    cRef TEIヘダー内の要素refsDeclで定義されているスキームにある, 標準的な参照により,当該ポインタの参照場所を示す.
  • ref 他の場所への参照を定義する.多くは,追加テキストまたはコメントを含む.
    target ひとつ以上のURIで,参照先を特定する.
    cRef 当該参照先は,TEIヘダーにある要素refsDeclで定義されてい るスキームの標準的な参照により示される.
要素ptr と要素refは,クラスのメンバーである. クラスatt.pointingメンバー は,以下の属性を取ることができる.
  • att.pointing URIにより要素を参照する要素に共通して付与される属性を定 義する.
    type 当該ポインタの種類を示す.
    evaluate 当該ポインタの参照先がポインタである場合,その意図を示す.
この2つの要素は,同じように使うことができる. 違いは,要素ptrは空要素であり, 要素refは, 内容を取ることが可能で,それにより相互参照の対象について,より 正確に記述することができる. 要素refの要素内容は,人が読める参照になっ ていることから,それだけで参照を示すことも可能である. 例えば,以下のようになる.
See <ref>section 12 on page 34</ref>.
一般には,属性targetを使い,相互参照 の対象を特定する方がよい. これにより,ソフトウェアは,それを参照することができる. 例えば,リンクを実現したり,参照を生成したり,それが解決できな い際には,エラーメッセージを出すことができるようになる. 先の例にあった,「section 12」は,以下のように符号化することも できる.
<div1 xml:id="SEC12">
<!-- ... -->
</div1>
これは,また,以下のように符号化することもできる.
See especially <ref target="#SEC12">section 12 on page 34</ref>.
相互参照が,ある決まったパタンで示されていたり,相互参照が本文 中には見えないようなものである時には,要素ptrを,以下のように 使うことができる.
See in particular <ptr target="#SEC12"/>.
相互参照では,同時に複数の場所を参照することも可能である. この様な相互参照は,属性targetの値に, 複数の識別子を付与することで実現する. この仕組みは,収録項目を符号化する際に便利であり,例えば,以下 のようになる.
<list>
 <item>Saints aid rejected in mel. <ptr target="#p299"/>
 </item>
 <item>Sallets censured <ptr target="#p143 #p144"/>
 </item>
 <item>Sanguine mel. signs <ptr target="#p263"/>
 </item>
 <item>Scilla or sea onyon, a purger of mel. <ptr target="#p442"/>
 </item>
</list>
この例では,相互参照の対象は,ページ番号になっている. 識別子としてあるp299p143などは,本文中にある,例えばページ区切 を示している.
<pb xml:id="p143"/>
...
<pb xml:id="p144"/>
...
<pb xml:id="p263"/>
...
<pb xml:id="p299"/>
...
<pb xml:id="p442"/>
...
属性typeは,相互参照の分類を示すため に,どこでも使うことができるが,書誌情報への参照において,特別 な処理(例えば,普遍的でありながら短い記述による参照)が必要な場合 には,以下のようにすることができる.
Similar forms, often called
<term rend="ldquo rdquo">rewriting systems</term>, have a long history
among mathematicians, but the specific form of <ptr target="#fig22"/>
was first studied extensively by Chomsky <ptr type="bibliogtarget="#chom59"/>.
<!-- ... -->
<figure xml:id="fig22">
<!-- ... -->
</figure>
<!-- elsewhere, in the bibliography -->
<bibl xml:id="chom59">
<!-- citation for the book referenced above -->
</bibl>
2番目の要素ptrにある属性typeの値bibliog は,参照される対象が,書誌情報であることを示している. これは,1番目の要素ptrでは,単に相互参照で あることが示されていることとは,異なっている. いずれの場合でも,属性targetの値は,他の 要素への参照になっている.

要素ptrと要素refは, これまで本節で解説している相互参照を示す以上の目的で,使うこと ができる. 16 リンク,分割,統合や, 17 簡易分析機能や, 18 素性構造で解説する,分 析向けの手法を使うことで,テキストによる分析を対象とリンク付 けたり,対応する部分を繋げたり,時間など他の軸が異なるテキス トを統合したりすることができる.

3.7 リスト

以下にある要素は,リスト,その項目,そのラベルなどを符号化す るものである.
  • list リストのような,項目列を示す.
  • item リストのいち項目を示す.
  • label リスト中の項目に関連するラベルを示す.用語集においては, 定義される用語を示す.
  • head 各種の見出しを示す.例えば,節のタイトル,リストや用語集, 手書き資料 の解説などにある見出し.
  • headLabel リストなどにおけるラベルや,用語集などにおけ る語彙を示 す.
  • headItem 用語集などのリスト構造における各項目の見出しを示す.

要素list には,各種のリストが記録される. 例えば,数値,文字,箇条書き記号などで示されたものが対象とな る. 元資料にリストとして記録されているものは,普通は,属性typeと共に,この要素で記録される. 追い込みテキストとして示されているリストも,適切であると判断 されれば,この要素で記録することができる.

リスト中の各項目は,要素itemで記録されるべきである. 項目に付いている連番やその他の識別子が,重要ではない,または ソフトウェアで自動的に再生できる場合には,それを記録する必要 はない. そのような識別子も符号化するのであれば,要素itemに属性 nを使うか,または要素labelを使 い,記録することができる. 例えば,以下の例は,同じものである.
I will add two facts, which have seldom occurred in
the composition of six, or at least of five quartos.
<list rend="runontype="ordered">
 <label>(1)</label>
 <item>My first rough manuscript, without any
   intermediate copy, has been sent to the press.</item>
 <label>(2)</label>
 <item>Not a sheet has been seen by any human
   eyes, excepting those of the author and the printer:
   the faults and the merits are exclusively my own.</item>
</list>
I will add two facts, which have seldom occurred in
the composition of six, or at least of five quartos.
<list rend="runontype="ordered">
 <item n="1">My first rough manuscript, without any
   intermediate copy, has been sent to the press.</item>
 <item n="2">Not a sheet has been seen by any human
   eyes, excepting those of the author and the printer:
   the faults and the merits are exclusively my own.</item>
</list>
この2種類の書き方を,同時に使うことができない. どちらか一方を使う必要がある.
リストは,必ずしも,リスト形式で表示される必要はない. 例えば,以下にある例は,(元々は)1段落の中に記されていたリスト を符号化したものである.
On those remote pages it is written that animals are divided into
<list>
 <item n="a">those that belong to the Emperor, </item>
 <item n="b">embalmed ones, </item>
 <item n="c">those that are trained, </item>
 <item n="d">suckling pigs, </item>
 <item n="e">mermaids, </item>
 <item n="f">fabulous ones, </item>
 <item n="g">stray dogs, </item>
 <item n="h">those that are included in this classification, </item>
 <item n="i">those that tremble as if they were mad, </item>
 <item n="j">innumerable ones, </item>
 <item n="k">those drawn with a very fine camel's-hair brush, </item>
 <item n="l">others, </item>
 <item n="m">those that have just broken a flower vase, </item>
 <item n="n">those that resemble flies from a distance. </item>
</list>
リストには,見出しやタイトルが付けられる事がある. そのようなものは,要素headにより,以下にある例のように,記録す ることができる. また,要素labelを使い,各要素と関連する,数字やア ルファベットによる見出しに留まらない語句を,表やリストの項目と してに記録することができる.
<list type="gloss">
 <head>Report of the conduct and progress of Ernest Pontifex.
   Upper Vth form — half term ending Midsummer 1851</head>
 <label>Classics</label>
 <item>Idle listless and unimproving</item>
 <label>Mathematics</label>
 <item>ditto</item>
 <label>Divinity</label>
 <item>ditto</item>
 <label>Conduct in house</label>
 <item>Orderly</item>
 <label>General conduct</label>
 <item>Not satisfactory, on account of his great
   unpunctuality and inattention to duties</item>
</list>
リストにある,各項目には,さらなる内部構造を持つことがある. 例えば,複雑なものでは,ひとつの項目が複数の構成要素を取ること があり,それは「表」として扱ったよいことがある. この様な場合については,14 図・表・式を参照のこと. 2列の表のうち,特に重要なものは「用語リスト」で,これは,要 素list type="gloss"で記録されるべき である. このリストでは,要素labelには用語が記録され, 要素item には,その解説が記録される. 属性がtype="gloss"とされているリストは,意味的に問 題がある. 例えば,次のような場合である.
<list type="gloss">
 <head>Unit Three — Vocabulary</head>
 <label xml:lang="la">acerbus, -a, -um </label>
 <item>bitter, harsh</item>
 <label xml:lang="la">ager, agrī, M. </label>
 <item>field</item>
 <label xml:lang="la">audiō, īre,
   īvī, ītus </label>
 <item>hear, listen (to)</item>
 <label xml:lang="la">bellum, -ī, N. </label>
 <item>war</item>
 <label xml:lang="la">bonus, -a, -um </label>
 <item>good</item>
</list>
また,3.3.4 用語,注釈,同等語,解説で解説した 要素term や,要素gloss は,用語リストにある各列の役割を明示するために使うことができる. 例えば,以下のようになる.
<list type="gloss">
 <head>Unit Three — Vocabulary</head>
 <label>
  <term xml:lang="la">acerbus, -a, -um</term>
 </label>
 <item>
  <gloss>bitter, harsh</gloss>
 </item>
 <label>
  <term xml:lang="la">ager, agrī, M. </term>
 </label>
 <item>
  <gloss>field</gloss>
 </item>
 <label>
  <term xml:lang="la">audiō, -īre, -īvī, -ītus</term>
 </label>
 <item>
  <gloss>hear, listen (to)</gloss>
 </item>
 <label>
  <term xml:lang="la">bellum, -ī, N. </term>
 </label>
 <item>
  <gloss>war</gloss>
 </item>
 <label>
  <term xml:lang="la">bonus, -a, -um</term>
 </label>
 <item>
  <gloss>good</gloss>
 </item>
</list>
この例では,グローバル属性xml:langが,要 素label(また は要素term)の 言語を示していることに注意して欲しい. 属性xml:langについての詳細は, 1.3.1.1 グローバル属性と, vi.i 言語の識別 を参照のこと. 用語集をより詳細に符号化するとして,見出し語と文法的な情報を分けて 記録する場合については,9 Dictionariesを参照のこと.
リスト全体の見出しやタイトルを記録するためには,要素headが, 2列の表を使う用語集の見出しには,要素 headLabelheadItemが用意 されている.
The simple, straightforward statement of an idea is
preferable to the use of a worn-out expression.
<list type="gloss">
 <headLabel>TRITE</headLabel>
 <headItem>SIMPLE, STRAIGHTFORWARD</headItem>
 <label>bury the hatchet </label>
 <item>stop fighting, make peace</item>
 <label>at loose ends </label>
 <item>disorganized</item>
 <label>on speaking terms </label>
 <item>friendly</item>
 <label>fair and square </label>
 <item>completely honest</item>
 <label>at death's door </label>
 <item>near death</item>
</list>
要素label, 要素head, 要素headLabel,要素headItem は,句レベルの要素を含むことができる. 但し,要素itemは,段落,すなわち,塊レベルの要素を 含むこともできる. 例えば,用語リストに,2つの項目があり,各項目がリストになって いるような場合である.
<list type="gloss">
 <label>EVIL</label>
 <item>
  <list type="simple">
   <item>I am cast upon a horrible desolate island, void
       of all hope of recovery.</item>
   <item>I am singled out and separated as it were from
       all the world to be miserable.</item>
   <item>I am divided from mankind — a solitaire; one
       banished from human society.</item>
  </list>
 </item>
 <label>GOOD</label>
 <item>
  <list type="simple">
   <item>But I am alive; and not drowned, as all my
       ship's company were.</item>
   <item>But I am singled out, too, from all the ship's
       crew, to be spared from death...</item>
   <item>But I am not starved, and perishing on a barren place,
       affording no sustenances....</item>
  </list>
 </item>
</list>

この手法を使い,異なる種類のリストを,任意の深さで入れ子化する ことも可能である.

3.8 注釈と索引

3.8.1 注釈

以下にある要素は,元テキストにあったり,符号化する人が付加 したりする,散見する注釈を記録するためのものである.
  • note 注釈・コメント.

「注釈」とは,テキスト中で付加されたコ メントで,本文とは別の流れを作るものとして,記録されるもの である. 注釈は,それが割注や,脚注,傍注,章末や巻末にまとめられ た注釈であっても,これらは全て,同じ要素noteで 記録されるべきである.

注釈には,異なる人物や異なる文字で書かれたものや,著者によ る注釈や,編集者が後で付けた注釈などもある. これらの違いは,以下で紹介するように,属性を使い記録するこ とができる.

可能であれば,注釈の文は,それが本文中に挿入されるべき場所 に,まずその指標が示され,同時に,そこに埋め込まれるべきで ある. 但し,例えば,傍注の場合には,これを埋め込むことはできない. 簡単な方法は,該当する段落や要素の前に傍注の場所を示すことである. 但し,ある場合には,注釈を付加する場所にそれを転記するので はなく,それが表示されるときの場所(例えば,巻末や章末など. 一般に脚注はこれに該当しない)に記録することがある. このような場合には,属性targetや 属性targetEndを使い,その場所を特 定すべきである. また,ある場合には,注釈の場所を明示せずに,あるテキストの 範囲で示すこともある. これらについては,3.6 簡単なリンクと相互参照を参照のこと.

例:
<l>The self-same moment I could pray</l>
<l>And from my neck so free</l>
<l>The albatross fell off, and sank</l>
<l>Like lead into the sea.
<note type="authplace="margin">The spell begins to break</note>
</l>
Collections are ensembles of distinct entities or objects
of any sort.<note n="1place="foot">We explain below why we use
the uncommon term <mentioned>collection</mentioned>
instead of the expected <mentioned>set</mentioned>.
Our usage corresponds to the <mentioned>aggregate</mentioned> of many
mathematical writings and to the sense of <mentioned>class</mentioned>
found in older logical writings.</note> The elements ...

元資料にある注釈を転記する際に,研究者は,電子テキスト字体に も注釈を付けたいときがある. 例えば,構造付きの分析的な注釈を,本文中の特定の句に付加して, 当該テキストのテーマやトピックを特定するような場合である. この様な場合には,空要素spanを使うことができる. この要素は,分析モジュールが導入されたときに使うことができる (17.3 部分と解釈を参照).

3.8.2 索引

学術テキストの索引を作る作業には,多くの判断や分析が求められ る技能が必要となる. 従って,この作業に,情報検索向けのソフトウェアを使うという単 純なことはできない. そのようなソフトは,テキストを探すぐらいの,補完的な役割しか 果たせない. 索引の役割とは,キーワードとなる語句が,ある場所へのアクセス を提供するもので,その索引語は,案内されたテキスト中に必ずし も存在する必要はない. この索引を作る作業には,技能が求められる.

3.8.2.1 既存の索引
既にテキストが存在する場合,その索引は,それを自動的に作り 出すのではなく,あるままにテキストとして符号化する方がよい. 本ガイドラインで解説されている要素は,そのような目的のため の要素である. 例えば,要素div1や要素divは,索引を含むテキスト部分を 記録するために使うことができる. また,要素listは,索引そのものを記録するた めに使うことができる. その際,各項目は,要素itemに記録され,その中に, 一連の要素ptrや要素 refを取 ることができる. 例えば,以下のようになる.
<div type="index">
<!--...-->
 <list type="index">
  <item>Women, how cause of mel. <ref>193</ref>; their vanity in
     apparell taxed, <ref>527</ref>; their counterfeit tears
  <ref>547</ref>; their vices <ref>601</ref>, commended,
  <ref>624</ref>.</item>
  <item>Wormwood, good against mel. <ref>443</ref>
  </item>
  <item>World taxed, <ref>181</ref>
  </item>
  <item>Writers of the cure of mel. 295</item>
<!--...-->
 </list>
</div>
この例簡単な例では,最初の項目の中で,入れ子化された複雑な構 造は採用されていないことに注意して欲しい. より正確に符号化すれば,以下のように,入れ子化したリストを取 ることもできる.
<item>Women,
<list>
  <item>how cause of mel. <ref>193</ref>;</item>
  <item>their vanity in apparell taxed, <ref>527</ref>;</item>
  <item>their counterfeit tears <ref>547</ref>;</item>
  <item>their vices
  <list>
    <item>
     <ref>601</ref>,</item>
    <item> commended, <ref>624</ref>.</item>
   </list>
  </item>
 </list>
</item>
ページ参照は,要素refで記録され,そこで当該場所へのリンク が示される. (例えば)属性target中に,該当するページ区切を示す要素の識別子が 記録されることになる.

<!-- in the text --><pb xml:id="P624"/>
<!-- start of page 624 -->
<!-- in the index -->
<ref target="#P624">624</ref>
この種のリンクに関する詳細は,16 リンク,分割,統合にある. 似たような手法は,目次を符号化する際にも使えることに注意して欲しい. 詳細は,4.5 前付けにある.
3.8.2.2 自動生成の索引

機械可読テキストから,自動的に,新たな索引を作ることができれ ば,それがここまでに解説された要素により既に符号化されてりた り,他の資料から既に転記されていた場合であっても,やはり便利である. 当該テキストの複雑さやそのテーマにも依るが,索引を自動的に作 ることは,研究者の要望全てに応えるものではない. けれども,このような機能は,索引を作る専門家が,詳細な索引を 作る際,例えば,編集後のテキストからさらに索引を付加したり, 既存の索引索引を保持しながらの符号化を進める作業を,助けてく れる.

索引には,一般に,特定のページや節への参照や,ページの範囲を 示す参照がある. このどちらも,以下の要素で記録することになる.
  • index 索引項目化されるものの場所を示す.
この要素は,17.3 部分と解釈にある要素interpと同じく, テキスト中の場所に関して,記述的・解釈的なラベルを記録するこ とができる. 分析のためのソフトウェアは,この情報を元に処理することになる. 但し,この要素の本来の目的は,印刷版において,索引の生成を助 けることにある. 要素indexは,テキスト中,要素の間, 要素の中でも,どこでも使うことができる. ここで示された項目の,索引の見出し語は,要素indexの中の,要素termで示される. 索引が生成される場所は,本文中にPIで示すことができる. 例えば,以下のようになる(PIの形式は,使用するソフトウェアに 依存する).
<?tei indexplacement ?>
または,特別な要素divGenを使うことも可能である.
一番簡単な方法は,ひとつの見出し語を,要素index中の,要素termで示す ことである.
<p>The students understand procedures for Arabic lemmatisation
<index>
  <term>Lemmatization, Arabic</term>
</index>and are beginning to build parsers.</p>

これにより,‘Lemmatization’の索引項目が,要素indexが本来 ある場所に作られることになる. The effect of this will be to generate an index entry for the term‘Lemmatization’,referencing the location of the original index element.

アラビア語の見出しの場合,生成された索引項目は,一連の場所(例 えば,ページ番号)を参照する必要がある. この様な場合,開始点と同様に,終了点も示す必要がある. 一番簡単な方法は,空要素anchor(詳細は16 リンク,分割,統合を参照)を当該の場所 で使い,要素indexと属性spanToで,その範囲を指示することである.
<p>We now turn to the
topic of Arabic lemmatisation
<index spanTo="#ALAMEND">
  <term>Lemmatization, Arabic</term>
 </index> concerning which it is important to note .....
<!-- much learned material omitted here -->
and now we can build our parser.<anchor xml:id="ALAMEND"/>
</p>

これにより,先の例と同様の索引項目を生成することができる. 但し,この参照は,ある一点ではなく,要素indexの場所 から「ALAMEND」で示された場所までの 範囲を示している. 従って(例えば,この間にある)一連のページ番号も含むことになる.

本文中にある要素indexの場所は,自動的に索引を作る際の, 参照場所を示しているが,当該要素のテキスト内容自体は,索引項目を作 るためには使われない. 索引項目としてある用語は,要素termの要素内容とは無関係に,単独に記録される. 従って,この要素内容は,必要なだけ繰り返されることになる. これを逐次的にする必要はない. (上例のように)綴りを正規化する範囲を指定したり,所望する形式に よる索引を作る助けとなる何らかの修正を施す範囲を指定すればよい.

例えば,索引語が,他の言語であったり,数学の式等を含んでいたり する場合には,索引語が正規化したものであったとしても,それを処 理するソフトウェアでは,望む結果を得るには,不十分なことがある. このような場合には,属性sortKeyを,以 下のように使うことができる.
<p>The @ operator
<index>
  <term sortKey="0000">@</term>
 </index>
precedes an attribute name</p>
ここでは,記号「@」は,索引中に出現するものの,アルファベット順に よる並び替えの対象とはならず,あたかも文字列「0000」と同じ扱いをされることになる. この手法は,5 標準化されていない文字と字形の表現で解説する,要素g を使い,ユニコードにない文字やグリフを入力するときにも便利である. 以下の例では,グリフが5 標準化されていない文字と字形の表現で解 説されている要素により定義され,そのコードが「PrinceGlyph」となっている.
<char xml:id="PrinceGlyph">
<!-- definition of the glyph here -->
</char>
<p>The Artist formerly known as Prince <index>
  <term sortKey="Prince">
   <g ref="#PrinceGlyph"/>
  </term>
 </index>...</p>
属性sortKeyの値が付与されていない場合には,並び替えのソフトウェア は常に要素term の内容をソートの対象とする.
一般には,複数の索引項目が同時に処理される. 例えば,詩人の伝記には,研究テーマ毎に,詩への参照が索引項目と して用意されたり,他の作家による作品への索引項目や,地名や歴史 的な人物の索引項目などが,用意されたりする. 属性indexNameは,複数の特定索引項目に,索引語と場所をまとめる ために使うことができる.
<p>Sir John Ashford
<index indexName="INDEX-PERSONS">
  <term>Ashford, John</term>
 </index>
was, coincidentally, born in
<index indexName="INDEX-PLACES">
  <term>Ashford
     (Kent)</term>
 </index>Ashford...</p>
研究資料では,索引は階層構造を持つことが多い. 例えば,「TEI」「markup」のような項目で, 「TEI, markup practices, index terms」という記述には, 最上位に「TEI」が,続くレベルに下位範疇が,さらにその 後にも下位の範疇が示されているといえる. この様な階層構造を持つ索引リストを記録するには,要素indexを入れ 子化することになる. 例えば,索引項目「lemmatisation」の下位に「Arabic」「Sanskrit」 などをとる場合を考えてみる. この様な場合には,要素indexを入れ子化すればよい.
<p>The students understand procedures for Arabic lemmatisation
<index>
  <term>lemmatization</term>
  <index>
   <term>arabic</term>
  </index>
 </index>
...</p>
バートンの『Anatomy of Melancholy』 からの索引項目も,これと同じように作ることができる. 例えば,索引項目を作るために,テキスト本文の193ページに,要素 indexを以下のように記すことができる.
<index>
 <term>Women</term>
 <index>
  <term>how cause of mel.</term>
 </index>
</index>
同じく,601ページに要素indexを,以下のように記すことができる.
<index>
 <term>Women</term>
 <index>
  <term>their vices</term>
 </index>
</index>
624ページにある要素indexでは,以下のような構造をとることも 可能である.
<index>
 <term>Women</term>
 <index>
  <term>their vices</term>
  <index>
   <term>commended</term>
  </index>
 </index>
</index>

これらの要素indexを処理する際には,構造を明確に するために繰り返し書かれているものは,一般には,まとめられ,最 終的には,先に紹介したような索引項目(訳注: 3.8.2.1 既存の索引に ある例)が出来上がる. けれども,本ガイドラインでは,これを推奨するものではない.

先に解説したPIや要素divGenを使い, 要素indexから抽出された項目を,どこに挿入すべきか を示すことができる. 例えば,典型的な例として,奥付の中に,これを使うことができる. 但し,これは必須ではない. 要素divGenを使う場合には,属性typeにより,生成される索引の種類を指定する ことが可能である. この属性値は,関連する要素indexにある属性indexNameの値と,対応すべきである.
<back>
 <div type="appendix">
  <head>参考文献</head>
  <listBibl>
   <bibl> ... </bibl>
  </listBibl>
 </div>
 <divGen n="Index Nominumtype="INDEX-NAMES"/>
 <divGen n="Index Locitype="INDEX-PLACES"/>
</back>
この例では,グローバル属性nを使い,生 成される索引の名前または識別子が指定されている. 生成される索引に必要な付加情報,例えば,見出し語などは,要素divGenの内容として指定される.
<back>
 <divGen n="A1type="INDEX-NAMES">
  <head>An Index of Names</head>
 </divGen>
</back>

PIが使われる場合には,生成される索引の為のパラメータは,別の方 法で示すことができる.

印刷物においては,人手により作られた索引で,ここで紹介するよ うな符号化,つまり,相互参照というものは,不可能である. 例えば,テキスト中にある「TEI」への参照を全て,索引「Text Encoding Initiative」にまとめた場合,「Text Encoding Initiativeを 参照」とあるテキストも,該当箇所として扱う方が便利である. この様な内部相互参照は,索引を自動生成した後の編集で,記録する必 要がある.

3.9 図等の非テキスト内容

図やグラフなどの絵的なものは,各種テキストの中で,様々な用途で使われている. ある時は,テキストの一部としてある(例えば,漫画などでは,テキス ト自体が絵的である). またある時は,選択的なテキストとしてある. また,その絵的なものがなければ,テキストが理解できない場合も ある. 逆に,その絵的なものが,作品の理解に影響しないこともある. 従って,テキスト中にある絵的なものをどのように符号化するかと いう方針は,重要である. 「生来デジタル」の文書であれば,絵的なものや,非テキストの部 分は,何もなくとも,電子化することができるかもしれないが,文 書館に収録されている文書の場合には,編集方針が必要となる.

例えば,文書構造の構成要素を考えたとき,絵的なものは,当該テ キスト中にある特定の場所に記録することができる. または,「自在要素」として,特定の領域内,例えば章や節におい て,または完全に自由に,出現するものとして,記録することがで きる. この種の絵的なものは,一般に,見出しやラベルを伴い,構造を持 つことがある. この様なケースに向けて,本ガイドラインでは,以下にある要素の 使用を推奨している.
  • figure 図表を示すまたは含む要素をまとめる.
  • graphic/ テキスト列中にある図,絵,図表の場所を示す.
  • binaryObject 行中の画像やその他のオブジェクトを示す,符号化されたバイナリデータを 示す.
絵的な内容を符号化するには,いくつかの方法がある.
  • 非XML形式,例えば,PNGやJPEGといったバイナリ形式.
  • XML形式.例えば,SVG.
  • TEI形式.例えば,19 グラフ,ネットワーク,木で紹介する, 木やグラフ向けの表記方法.
最後の2つでは,絵的なものは,XMLで表現されることになる. 2番目手法では,SVG名前空間を利用して,その絵的な内容は,完全に 再構成されるように,定義される. 1番目の手法では,要素graphicにより,XML 文書外にある,絵的な内容の存在のみを記録し,実データの場所は, 属性urlで示されることになる. または,絵的な情報は,XML文書中に直接,バイナリ形式で埋め込 まれる. その際には,要素binaryObjectを使い,Base64等の形式で記録され る.
要素graphicと要素binaryObjectは,クラスmodel.graphicLikeのメンバーである. また,これらの要素は,クラスatt.internetMediaのメンバーでもある. このクラスから,以下の属性が継承されている.
  • att.internetMedia 標準的な用語による計算機資源の種類を表す属性を示す.
    mimeType 当該データのMIMEタイプ.
例えば,以下にある一節は,元テキストにある画像のコピーデータ が,場所がURL「zigzag2.png」に,PNG 形式でデータ化されていることが示されている.
<p>These were the four lines I moved in
through my first, second, third, and
fourth volumes. -- In the fifth volume
I have been very good, -- the precise
line I have described in it being this :
<graphic url="zigzag2.pngmimeType="image/png"/>
By which it appears, that except at the
curve, marked A. where I took a trip
to Navarre, -- and the indented curve B.
which is the short airing when I was
there with the Lady Baussiere and her
page, -- I have not taken the least frisk
...</p>
要素graphicと要素binaryObjectは,句レベルの要素であること から,テキスト内容が記録される場所で使うことができる. 但し,段落や見出しの間では使うことはできない. 以下にある例では,符号化する人は,印刷時に付けられた装飾を,見 出しとして扱っている.
<head>
 <graphic
   url="http://www.iath.virginia.edu/gants/Ornaments/Heads/hp-ral02.gif"/>

</head>
.

14.3 画像データ向けの要素にある要素figureに より,また別の記録の仕方がある. 例えば,複数の画像を,階層構造または束として扱うことができる. また,画像と一緒に,見出しや解説といった付加的な情報も記録する ことができる.

3.10 参照システム

「参照システム」とは,名前,すなわち参照が,テキストにある特 定の一節を関連づける仕組みである (例えば,Ps. 23:3とい う参照で,Psalm 23にある3行目を,Amores2.10.7という参照で,2番目の本 の,10番目の詩の,7行目を関連づける). この様な名前を使い,テキスト中にある場所を示すことが可能で, これにより,利用者はその場所を見いだすことができる. 参照システムは,構造上の単位(例えば,章,段落,分,連,詩)や, 印字上の単位(例えば,ページや行番号),参照のために作られた区 分(例えば,書誌情報中の段落や行)を基本単位に,作られている. あるテキストがあるとして,それを電子化する際には,そこにある 印刷による参照システムが,電子版による参照システムと,簡単に 比べることができるような場合にだけ,元の参照システムを電子化 すべきである.

参照システムは,TEIのスタイル従い,符号化することができる. 例えば,以下のようになる.
  • 参照システムが既に存在し,それが,符号化する際に使われる 論理構造と同じものを元にしている場合には,グローバル属性 xml:idまたはnを使い,当該一節を参照することができ る. または,複数のレベルにある要素にある属性値をまとめて,示 すことも可能である. この詳細は,3.10.1 属性xml:idと属性nにある.
  • 既存の参照システムがない場合には,グローバル属性xml:idまたはnを使い,それを構築することができる (例えば,電子形式のコレクションやコーパス). この詳細は,3.10.2 オリジナルの参照システムにある.
  • 符号化する際に使われる論理構造とは異なる単位を元にする, 既存の参照システムがある場合(例えば,構造的な区分ではな く,特定の版のページや行を単位とベースとしたもの),参照 システムを作る論理構造の単位は,様々であり得る. この詳細は,20 非階層構造にある.
  • 特定の論理構造に依存しない,または論理構造は利用しない, 既存の参照システムがある場合,そのような参照システムは, 要素milestoneを使 い,符号化することができる. この要素は,参照システムで場所が変わるところを示すもので ある. 詳細は,3.10.3 標石要素にある.
既存または新規の参照システムを記録する特定の方法は,TEIヘダー で宣言されるべきである. この詳細は,3.10.4 参照システム宣言16.2.5 規範参照にある.

既存の参照システムがない場合,当ガイドラインでは,最低限とし て,元テキストにあるページ区切は,本節で解説される方法で, 記録することを推奨している. ページ区切を符号化することは,詳細な参照システムを持ったテキ ストにおいても,推奨されることである. 散文では,行区切りも,必要ではないかもしれないが,符号化する ことができる. 13

3.10.1 属性xml:idと属性n

既存の参照システムが,階層的なテキスト構造を使い,それがマー クアップ上でも反映されている場合には,属性nを使い,各構造上の単位に,従来型の識別 子を付与することができる. 属性nは,その他にも,元テキストに あるリスト項目や節の番号を,それが重要と判断されるとき,例 えば,連番にはなっていない時に,それを記録することができる.

例えば,オービットの「Amores」 の2巻にある10番目の詩の7行目を参照するとしよう. 巻や詩,行は,作品の構造を作る単位と考えられることから,こ れを符号化することができる(韻文における構造単位についての 詳細は,6 韻文を参照のこ と). この場合,既存の参照システムで使われている,構造単位の番号 を,属性nで記録すると便利である. 例えば,以下のようになる.
<div1 n="Amorestype="volume">
 <div2 n="1type="book">
<!-- ... -->
 </div2>
 <div2 n="2type="book">
  <div3 n="1type="poem">
<!-- ... -->
  </div3>
  <div3 n="2type="poem">
<!-- ... -->
  </div3>
<!-- ... -->
  <div3 n="10type="poem">
   <l n="1"> ... </l>
   <l n="2"> ... </l>
<!-- ... -->
   <l n="7"> ... </l>
  </div3>
<!-- ... -->
 </div2>
<!-- ... -->
</div1>
テキスト中の各部分に属性nを付与して, 全てを対象とした参照システムを設けたいと思うこともあるだろう が,これは,ファイル中の記述を増やすことになる.
<div1 n="Amorestype="volume">
 <div2 n="Amores 1type="book">
<!-- ... -->
 </div2>
 <div2 n="Amores 2type="book">
  <div3 n="Amores 2.1type="poem">
<!-- ... -->
  </div3>
<!-- ... -->
  <div3 n="Amores 2.10type="poem">
<!-- ... -->
   <l n="Amores 2.10.7"> ... </l>
<!-- ... -->
  </div3>
<!-- ... -->
 </div2>
<!-- ... -->
</div1>
既存の参照システムで使われている名前が識別子として使えるまでに 形式化されている場合には,それを属性xml:idの値として使うことができる. この様に,名前空間を使わずに,参照値とする名前には,文字か下線 で始まり,続いて,文字,数字,ハイフン,下線,ピリオド,更には, XMLで定義された拡張文字や合字を使うことができる. 属性xml:idの値は, 属性nの値とは異なり, 当該文書内で,ユニークでなければならない. 例えば,以下のようになる.
<div1 n="Amorestype="volume">
 <div2 xml:id="am.1type="book">
<!-- ... -->
 </div2>
 <div2 xml:id="am.2type="book">
  <div3 xml:id="am.2.1type="poem">
<!-- ... -->
  </div3>
<!-- ... -->
  <div3 xml:id="am.2.10type="poem">
<!-- ... -->
   <l xml:id="am.2.10.7"> ... </l>
<!-- ... -->
  </div3>
<!-- ... -->
 </div2>
<!-- ... -->
</div1>

この様な標準的な参照システムの使い方を文書化したり,自動処理を 施すには,TEIヘダーの中で,属性nや属 性xml:idに参照値が記録されているのか, どの要素に参照やその被参照地点が記録されているのかを宣言するこ とが望ましい. 参照システムを宣言する例については,3.10.4 参照システム宣言を参照のこと.

属性nを使うことには,制約がある. 版によっては,複数の構造を持つことがあるため,複数の参照システ ムが必要となることがある一方で,属性nでは,1つの標準的な参照シ ステムしか使うことができない,という制約である. 例えば,「Amores」の別の版では,詩 10を,詩9と続くものとして扱っている場合,ある同じ行を「Amores 2.9.31」としてとして指定するこ とになる. この様な2つの参照システムを同時に記録するためには, 20 非階層構造で解説をする各種の手法を使うことができる.

3.10.2 オリジナルの参照システム

テキスト中に標準的な参照システムがない時には,必要であれば, 当該テキストを符号化した結果,電子テキスト中に生まれれる構造 を使い,参照システムを導入することができる. 長期利用に耐える参照システムで求められるように,参照は,定着し た,変更されない場所であることが,重要になってくる. 当該テキストが,修正・変更されたた場合においても,参照システ ムで使われる,テキストの任意の部分を示す識別子は,同じ部分と 関連し続ける必要がある. これは,参照番号が連番でなくなった場合でも,そうである( 参照としてあった連番が使い物にならなくなっている場合,新し い参照システムは,既存のシステムとは別に作られることになる).

グローバル属性nxml:idは,参照識別子をテキスト中の区分に 付与するために使われる. これらの属性に付与される識別子は,それが付加される要素全体に 対応するものとなる. ID型の属性は,同一文書中で,必ずユニークな値である. また,その値は,文字から始まる必要がある. このような制約は,属性nの値には課せ られていない.

属性xml:idや属性nに,文書構造上,ユニークな値を自動的に付 与する便利な方法として,「ドメイン型のアドレス」すなわち,構 造上の各階層を代表する構成要素を,ピリオドでつなぐ表記法がある. この方法には,2つのスタイルがある. ひとつは「有型パス」と呼ばれるもので,識別子が, 「要素型 - 数字」 という構造になっているものである. この要素名では,要素の型を特定し,その要素型において選択され る要素を数字で特定する(ハイフンと数字は,同型の要素がひとつ しか内場合には省略できる). もうひとつは「無型パス」はと呼ばれるもので,識別子は, 数字から構成されている. 各数字は,各階層レベルにあるノード列中の要素を特定している.

これら2つの方法で示された識別子において,その開始点は,要素 TEIや要素bodyではなく,要素textとすべ きである. 一般的な例ではないけれども,要素teiHeader向けに識別子が必要な場合, 要素TEIを開始点とすることも可能である. 要素body を根要素のように見なすと,前付けや後付に識別子を付与する必要 はなくなる. 根要素に対応する構成要素には,混乱が生じない限り,識別子は付 与しなくともよい. コレクションやコーパスでは,テキストや資料に付与されるユニー クな識別子が,根要素に対応する構成要素に付与されることになる だろう.

以下の例では,要素textにある各要素では,有型パスの識 別子が属性xml:idに付与され, 無型パスの識別子が属性nに付与 されている. 無型パスの属性値では,接頭辞として文字列「AB」が,当該テキストの一般的な識別 子として使われている.
<text xml:id="Text-1n="AB">
 <front xml:id="Frontn="AB.1">
  <div xml:id="Front.div-1n="AB.1.1">
   <p> ... </p>
  </div>
  <titlePage xml:id="Front.titlePagen="AB.1.2">
   <titlePart> ... </titlePart>
  </titlePage>
  <div xml:id="Front.div-2n="AB.1.3">
   <p> ... </p>
  </div>
 </front>
 <body xml:id="Bodyn="AB.2">
  <p xml:id="Body.p-1n="AB.2.1"> ... </p>
  <p xml:id="Body.p-2n="AB.2.2"> ... </p>
  <div xml:id="Body.div-1n="AB.2.3">
   <head xml:id="Body.div-1.headn="AB.2.3.1"> ... </head>
   <p xml:id="Body.div-1.p-1n="AB.2.3.2"> ... </p>
   <p xml:id="Body.div-1.p-2n="AB.2.3.3"> ... </p>
  </div>
  <div xml:id="Body.div-2n="AB.2.4">
   <head xml:id="Body.div-2.headn="AB.2.4.1"> ... </head>
   <p xml:id="Body.div-2.p-1n="AB.2.4.2"> ... </p>
   <p xml:id="Body.div-2.p-2n="AB.2.4.3"> ... </p>
  </div>
 </body>
</text>
有型パスと無型パスは,便利な識別方法ではあるが,参照システムを新 たにつくつ場合には,必ずしも,これを使う必要はない.

属性xml:idに,新たに作られた参照識別 子が記録されている場合には,絶対パスを記録すべきである. 属性nを使う場合には,絶対パスまたは, 当該要素の親要素から示すパスを記録することができる. 標準的な参照識別子の構成方法,それを持つ要素や,識別子となる属 性値は,2.3.5 参照システム宣言で解説するように,ヘダー中で宣言すべ きである.

3.10.3 標石要素

望ましい参照システムが,ある文書構造に対応していない場合,ま たは,当該文書が,複数の文書構造を持っている場合(詳細は 20 非階層構造)には,表現力は落ちるものの, 簡単である手法を採ることになるだろう. このような場合,一番簡単な対応策は,参照点が変更する地点を要 素milestoneを使い,記録することである.
  • milestone/ 当該セクションが,構造要素により表現することができない場合に,標準的 な参照機能により,テキストの各種セクション間にある境界点を示す.
  • pb/ テキストのページ境界を,標準的な参照システムにより示す.
  • lb/ ある版における新しい(印刷上の)行の始まりを示す.
  • cb/ テキストの段と段の境界を,標準的な参照システムにより示す.

これらの要素は,参照システム上のある分類点が,テキスト中で変 化する場所を記録するためのものである. これらの要素は,要素内容を持たないが,当該テキストを分割する, あるいは,道端にある標石のように,区分に分ける働きをする. 要素pb,要素cb, 要素lbは,標石要素の中でも, 特別な型を持つ要素で,それぞれ,ページ,カラム,行の境界を示 すものになる. これらの要素に付くグローバル属性nは, 当該標石要素と関連する特定の単位物を示すものである. 要素milestoneは,構造を構成 するものではないことから,参照システムを検証する際,XMLパー サはこれを解析することができない. 従って,これらの要素は,符号化する人またはソフトウェアの責任 において,適切な順番で記述されていることが保証されるものとな る.

標石要素は,テキスト中に,競合する2つの構造が含まれていると きに,役立つ. 例えば,英語の小説では,初出は連載として出版されることがよく あり,また,その1回分全体は必ずしも同一の章にはならないこと がある. 符号化する人は,章を元にした構造を,要素div1で記録 することが可能で,その時,同時に,要素milestoneを使い,各回の 終わりを記録することができる. また,この逆の使い方も可能である. 例えば,各回よりも章の方が重要であると判断し,第3章が第1回の途 中から始まり,第2回で終わる様子を,以下のように記録することができる.
<text>
 <body>
  <milestone unit="partn="1"/>
  <div1 n="1type="chapter">
   <p>
<!-- ... -->
   </p>
  </div1>
  <div1 n="2type="chapter">
   <p>
<!-- ... -->
   </p>
  </div1>
  <div1 n="3type="chapter">
   <p>
<!-- ... -->
   </p>
   <milestone unit="partn="2"/>
   <p>
<!-- ... -->
   </p>
  </div1>
 </body>
</text>
各回の方が,章よりも重要であると判断した場合には,例えば,以下 のようになる.
<text>
 <body>
  <div1 n="1type="part">
   <milestone unit="chaptern="1"/>
   <p>
<!-- ... -->
   </p>
   <milestone unit="chaptern="2"/>
   <p>
<!-- ... -->
   </p>
   <milestone unit="chaptern="3"/>
   <p>
<!-- ... -->
   </p>
  </div1>
  <div1 n="2type="part">
   <p>
<!-- ... -->
   </p>
   <milestone unit="chaptern="4"/>
   <p>
<!-- ... -->
   </p>
  </div1>
 </body>
</text>

標石要素は,同じ作品の異なる版を記録するためにも使うことがで きる. 属性edで版の種類を明示していない要 素を全て無視しても,参照システムを構成することは可能である.

簡単な例として,ある詩集の版E1では,最初から2つ目までの詩を 初版本のものと扱い,一方版E2では,1つ目の詩を序文として扱う 場合,これを以下のように符号化することができる.
<milestone ed="E1unit="work"/>
<milestone ed="E2unit="work"/>
<milestone ed="E1unit="book"/>
<milestone ed="E1unit="poem"/>
<milestone ed="E2unit="poem"/>
<milestone ed="E2unit="book"/>
<milestone ed="E1unit="poem"/>
<milestone ed="E2unit="poem"/>

この例では,属性nは使われていない. 理由は,数値は連番をなしており,従って,必要であれば再構築する ことが可能だからである.

属性nの値には,大きめの単位向けの識別 子も取ることができるが,これは必須ではない. 例えば,以下にある2つの例のいずれかを取ることができる.
<milestone ed="E1unit="workn="Amores"/>
<milestone ed="E1unit="bookn="1"/>
<milestone ed="E1unit="poemn="1"/>
<milestone ed="E1unit="poemn="2"/>
<milestone ed="E1unit="bookn="2"/>
もしくは,以下の例である.
<milestone ed="E1unit="workn="Amores"/>
<milestone ed="E1unit="bookn="1"/>
<milestone ed="E1unit="poemn="1.1"/>
<milestone ed="E1unit="poemn="1.2"/>
<milestone ed="E1unit="bookn="2"/>

要素milestoneを使い,行番 号を各行毎または周期的(5行毎,10行毎など)に記録することができる. 周期的な記録は簡単である. 各行毎の記録は,より堅固である.

属性nの値で採用される付番の方法につい て,制約はない. 例えば,先の例においても, 属性値をI.iI.iiI.iiiとして も同じ事である. 但し,「unnumbered」は特別な値として 予約されている. これは,通常の付番方法とは異なる(例えば,章の見出し,詩の番号, タイトル,韻文劇における話者の帰属など)場合に使うべき値となる.

属性edの値には,原則,制約はない. 属性値に何らかの制約を課した方がよいと判断された時には, 23.2 Personalization and Customizationで解説さ れる手法を使うことができる. 例えば,規定値から選択したものを属性値に使う場合などである.

例えば,以下にある3.10.4 参照システム宣言 では,参照システムの宣言の仕方が解説されている.

3.10.4 参照システム宣言

どのような参照システムを使うにせよ,それは 2.3.5 参照システム宣言で解説したように, TEIヘダー内にある要素refsDeclに記録されることが望ましい. 参照システムは,要素cRefPatternを使い,形式的に宣言する か,または,非形式的に散文で記録される. 前者の方法が推奨される. 理由は,散文による解説とは異なり,処理が可能になるからである.

例えば, 3.10.1 属性xml:idと属性nにある3つの例はにあ る参照システムは,以下のように定義することができる. 最初の例では,オービットの「Amores」の各レベル毎に参照を決めている. 要素div1, 要素div2, 要素div3, 要素lの各要素で,属性nが,レベル毎に独立して使われている. このような符号化方法は,ヘダー中に以下のように記録されるべき である.
<teiHeader>
 <fileDesc>
<!--... -->
 </fileDesc>
 <encodingDesc>
  <refsDecl>
   <cRefPattern
     matchPattern="([^ ]+)([0-9]+)\.([0-9]+)\.([0-9]+)"
     replacementPattern="#xpath(//div1[@n='$1']/div2[@n='$2']/div3[@n='$3']/l[@n='$4']">

    <p>A canonical reference is assembled with
    <list>
      <item>the name of the <label>work</label>: the
      <att>n</att> of a <gi>div1</gi>,</item>
      <item>a space,</item>
      <item>the number of the <label>book</label>: the
      <att>n</att> of a child <gi>div2</gi>,</item>
      <item>a full stop</item>
      <item>the number of the <label>poem</label>: the
      <att>n</att> of a child <gi>div3</gi>,</item>
      <item>the line number: the <att>n</att> value of a
             child <gi>l</gi>
      </item>
     </list>
    </p>
   </cRefPattern>
   <cRefPattern
     matchPattern="([^ ]+)([0-9]+)\.([0-9]+)"
     replacementPattern="#xpath(//div1[@n='$1']/div2[@n='$2']/div3[@n='$3']">

    <p>Same as above, but without the last component (full
         stop followed by the <gi>l</gi>'s <att>n</att>.</p>
   </cRefPattern>
   <cRefPattern
     matchPattern="([^ ]+) ([0-9]+)"
     replacementPattern="#xpath(//div1[@n='$1']/div2[@n='$2']">

    <p>Same as above, but without the poem component (full
         stop followed by the <gi>div3</gi>'s <att>n</att>.</p>
   </cRefPattern>
  </refsDecl>
 </encodingDesc>
</teiHeader>
2つ目の例では,同じ参照システムを前提としても, 各要素div1div2div3lにある属性nには,参照文字列が含まれている. 行のみを参照の対象とするのであれば,参照システムは,以下のよう に宣言することもできる.
<refsDecl>
 <cRefPattern
   matchPattern="([^ ]+[0-9]+\.[0-9]+\.[0-9]+)"
   replacementPattern="#xpath(//l[@n='$1')"/>

</refsDecl>
正規表現の部分は,丸括弧でまとめられている. この例では,要素l にある属性nの値が,そのマッチする対象とな る.
各行に加えて,詩も参照の対象とするのであれば,参照システムの宣 言は,以下のようにより複雑なものとなる.
<refsDecl>
 <cRefPattern
   matchPattern="([^ ]+[0-9]+\.[0-9]+\.[0-9]+)"
   replacementPattern="#xpath(//l[@n='$1')"/>

 <cRefPattern
   matchPattern="([^ ]+[0-9]+\.[0-9]+)"
   replacementPattern="#xpath(//div2[@n='$1')"/>

</refsDecl>
これにより, 要素div1,要素div2,要素div3,要素lにある属性nの値が,参照 文字列の対象となる.
3つ目の例でも,同じ参照システムを前提としてはいるが,参照文字 列は,属性xml:idの値に記録されて いる. これに対応する参照システム宣言は,以下のようにすることができる.
<refsDecl>
 <cRefPattern matchPattern="(.*)replacementPattern="#$1"/>
</refsDecl>
この様に記録をする利点は,一般にはあまりない. 属性targetの値に,標準的なURIを使う方が, 簡単である.
標石要素で記録された参照は,使っていることを宣言だけすることもできる. 以下にある例では,散文を使い, 3.10.3 標石要素で解説した例を宣言している.
<refsDecl>
 <p>Standard references to work, book, poem, and line may be
   constructed from the milestone tags in the text.</p>
</refsDecl>
または,版E1にある参照スキームの形式的な宣言を,以下のようにするこ とも可能である.
<refsDecl>
 <refState ed="E1unit="workdelim=" "/>
 <refState ed="E1unit="bookdelim="."/>
 <refState ed="E1unit="poemdelim=":"/>
 <refState ed="E1unit="line"/>
</refsDecl>

3.11 書誌項目の記述または参照

書誌情報(例えば,書籍,論文,フィルム,放送,歌などの 書誌項目の記述)または,それへの参照は,TEIテキスト中の至ると ころで現れる. また,2.2.7 元資料解説で解説 した,TEIヘダーにある元資料解説では,複数の場所でこれを記録 することになる. 書誌情報やそれへの参照は,本文中でも,単独で現れたり,リスト としてまとめて現れたりする. 手書き資料などでは,詳細な書誌情報の記述は必要になるだろう. 当ガイドラインでは,書誌情報に関する専用の要素を多く用意して いる. これらの要素は,クラスmodel.biblLikeのメンバー である. このクラスのメンバーには,以下のような要素がある.
  • bibl 厳密でない構造を持つ書誌情報の引用を含む.下位要素で明示 されていたり, いなかったりする.
  • biblStruct 構造を持った書誌情報を示す.下位要素として,書誌情報を示 す要素が決められた順番で出現する.
  • biblFull 厳密な構造を持つ書誌情報を示す.TEIのファイル記述の全要素は,ここに記述される.
これらの要素をリスト化したものは,以下の要素で記録することが できる.
  • listBibl 書誌項目引用のリストを示す.

印刷物では,書誌情報を構成する個々の項目は,伝統的に,それぞ れ独立して示され,本文の流れとは別のものとして,例えば,括弧 で括られたり,斜体で示されたり,特別な句点で示されたり,下線 を引かれたりしている. 電子物においても,この種の区別は,すなわち,ある特別な言語的 特性を持つテキストオブジェクトとして,参照が区別できることは, 出力を整形する際にも,検索をする際にも,重要なものとなる. 14

他のテキスト素性と同じく,参照にとって一番の関心事は,当該テ キストの印刷時にどのような書式を採るかではないことを,強調し ておく. 本節で解説するスキームが想定する区分は,多くの一般的なソフト ウェアで十分なものであるべきものであったとしても,必ずしも全 てのフォーマッタや,参照スタイルが求めるものではないかもしれない. 15 以下で解説する素性(詳細は3.11.2 書誌参照の構成要素)は,多くの書誌情 報やソフトウェアで有効なもので,また,既存の書誌情報や多く の図書目録にも対応している. 電子テキストへの対応についての詳細は,2.2.7 元資料解説を参照のこと. 図書目録についての簡単な解説は,2.7 書誌情報に関する注釈にある.

3.11.1 書誌参照

クラスmodel.biblLikeのメンバーは,多くの下位要素を持つこ とになる. 例えば,要素biblや要素biblStructは,同じ下位要素をとることが可能 で,その詳細は3.11.2 書誌参照の構成要素にある. また,要素biblFullは,下位要素として, 2.2 ファイル解説で示した要素をとる.

同じ要素も,状況が異なれば,異なるレベルで使われることにな る. 例えば,少しばかり,区別をする(例えば,題名や著者名を特定 する参照部分と,その他の部分を分ける)ために,当該参照内容 の程度を記録する場合がある. この場合,要素biblの中に,書誌情報向けの要素とテキ ストが混在することになる. 例えば,以下のようになる.
<p>A book which had a great influence on him
was <bibl>Tufte's <title>Envisioning Information</title>
 </bibl>, although he may
never have actually read it.</p>
実際には,符号化する人の中には,この様に書誌情報の参照を記録す る必要性を感じない人もいる.
<p>A book which had a great influence on him
was Tufte's <title>Envisioning Information</title>,
although he may never have actually read it.</p>
書誌情報の参照の中には,省略されるものがあり, 「Baxter, 1983」のような文字 列になってしまうこともある. バクスターの書籍の詳細が元テキスト中には書かれておらず,符号 化する人も何も示さない場合には,この参照は要素biblを使い,以下のように記録すべきである.
All of this is of course much more fully treated
in <bibl>Baxter, 1983</bibl>.
しかし,本ガイドラインや,現代における書誌情報の扱い方では, 書誌の「参照」と, 書誌の「参照地点(ポインタ)」 は,分けて考えるのが一般的である. 前者は,書誌項目の自己充足的記述である 後者は,短縮版の引用(例えば,Baxter,1983)で,一般には,完全版の 記述への場所を示す,つまりポインタとしての役割を担っている. 「Baxter,1983」のよう な短縮版の参照は,要素biblではなく,相互参 照として記録される. 詳細は,3.11.3 書誌ポインタ にある.
符号化する人が,書誌情報により詳細な構造を加えたい場合,例え ば,特定のスタイルシートや,検索ソフトに対応させたい場合には, 要素biblStructを使うべきである. 以下にある例は,後で,また取り上げることになる.
<biblStruct>
 <monogr>
  <author>Edward R. Tufte</author>
  <title>Envisioning Information</title>
  <imprint>
   <pubPlace>Cheshire, Conn.</pubPlace>
   <publisher>Graphics Press</publisher>
   <date>1990</date>
  </imprint>
 </monogr>
</biblStruct>
より複雑で,詳細な書誌情報の構造は,TEIヘダーで定義される要素 biblFullに記録される. この要素は,ある電子テキストのファイル解説を,別の電子テキスト 中で記録するために使うことができる(詳細は, 2.2 ファイル解説). このタグ使い方は,電子テキストに限定されるものではなく,例え ば,以下のように,他の書誌情報向けの要素と同じように,使うこと も可能である.
<biblFull>
 <titleStmt>
  <title>Envisioning Information</title>
  <author>Tufte, Edward R[olf]</author>
 </titleStmt>
 <extent>126 pp.</extent>
 <publicationStmt>
  <publisher>Graphics Press</publisher>
  <pubPlace>Cheshire, Conn. USA</pubPlace>
  <date>1990</date>
 </publicationStmt>
</biblFull>
書誌情報のリストは,どのような種類のものであれ,他のリストと同 様に記録することができる(詳細は,3.7 リスト). また,書誌情報のリストに特化した要素listBiblを使うこともできる. この2つの違いは,要素listは,要素itemを子要素 として含み,さらにその下位要素として,書誌情報向けの要素(例え ば,要素bibl,要素biblStruct,要素biblFull) や,他の句レベル要素,段落レベル要素をとることができる. 一方,要素listBiblは,ヘダーや一連の導入段落の 後に,書誌情報向けの要素しかとることができない. 前者は,散文で書かれた内容を,書誌情報向け要素のリストで示す際 に相応しく,後者は,より形式的に書誌情報を示す際に相応しい. 以下にある2つの例は,法律に関する書誌情報のリストを記録したも のである. 始めに,要素 listBiblで記録した例が,以下である.
<listBibl>
 <head>参考文献</head>
 <biblStruct xml:id="NELSON80">
  <analytic>
   <author>Nelson, T. H.</author>
   <title>Replacing the printed word:
       a complete literary system.</title>
  </analytic>
  <monogr>
   <title>Information Processing '80: Proceedings of the IFIPS
       Congress, October 1980</title>
   <editor>Simon H. Lavington</editor>
   <imprint>
    <publisher>North-Holland</publisher>
    <pubPlace>Amsterdam</pubPlace>
    <date>1980</date>
   </imprint>
   <biblScope>pp 1013–23 </biblScope>
  </monogr>
  <note>Apparently a draft of section 4 of
  <title>Literary Machines</title>.</note>
 </biblStruct>
 <bibl xml:id="NELSON88">Ted Nelson: <title>Literary Machines</title>
   (privately published, 1987)</bibl>
 <bibl xml:id="BAXTER88">
  <author>Baxter, Glen</author>
  <title>Glen Baxter His Life: the years of struggle</title>
   London: Thames and Hudson, 1988.
 </bibl>
</listBibl>
以下は,要素listを使っ た例である.
<list>
 <head>参考文献</head>
 <item>
  <bibl xml:id="NEL80">
   <author>Nelson, T. H.</author>
   <title level="a">Replacing the printed word:
       a complete literary system.</title>
   <title level="m">Information Processing '80:
       Proceedings of the IFIPS Congress, October 1980</title>
   <editor>Simon H. Lavington</editor>
   <publisher>North-Holland</publisher>
   <pubPlace>Amsterdam</pubPlace>
   <date>1980</date>
   <biblScope>pp 1013–23
   </biblScope>
   <note>Apparently a draft of section 4 of
   <title>Literary Machines</title>.</note>
  </bibl>
 </item>
 <item>
  <bibl xml:id="NEL88">Ted Nelson: <title>Literary Machines</title>
     (privately published, 1987)</bibl>
 </item>
 <item>
  <bibl xml:id="BAX88">
   <author>Baxter, Glen</author>
   <title>Glen Baxter His Life: the years of struggle</title>
     London: Thames and Hudson, 1988.
  </bibl>
 </item>
</list>

3.11.2 書誌参照の構成要素

この節では,書誌情報の参照でよく使われる構成要素について解説 する. これらは,4つのグループに分類される.
  • 「収録」「単刊」「シリーズ」レベル毎の構成要素.
  • 各種のタイトルや知的責任表示(作者など)
  • 出版,ページ立てなどに関する情報(多くはクラスmodel.biblPartのメン バー)
  • 注釈,コメント,詳説など.
以下の節では,要素biblまたは要素biblStructの内部で情報を記録する要素を紹介す る. 要素biblでは,クラスmodel.biblPartのメンバー や,他の句レベル要素,テキストデータをとることができる. 要素biblStructでは,各書誌情報の項目は独立し,決められた順番 で記録される. この詳細は以下で解説する(3.11.2.7 書誌項目の順序)
3.11.2.1 収録,単刊,シ リーズ
図書館では,独立した書誌の単位というものを,コレクショ ンを構成する単体や,単行本,雑誌,そしてコレクションそのも のとするのが,一般的である. また,逐次刊行の書籍の場合,そのシリーズと,シリーズ内の各 書籍は分けて捉えることになる. 逐次刊行されているコレクションを構成する作品には,3つのレ ベルの書誌情報をとることになる.
  1. 収録(された作品)レベル
  2. 単刊レベルでのタイトル,版,編集者など.
  3. シリーズレベルの,タイトル,編集者,巻・号など.
例えば,論文誌の論文は,少なくとも,2つのレベルの書誌情報 をとることになる. つまり,論文に相当する収録レベルと,論文誌に相当する単刊レ ベルである.
この3つのレベルは,要素biblの中で分けて記録することが可能で,要素 biblStructの中では,以下の要素を使 い,分けて記録することが必須である.
  • analytic 独立した出版物ではなく,書籍や雑誌に収録されている作品の書誌情報を記述する.
  • monogr 独立したもの(例えば,物理的に独立したもの)として出版された対象(例えば,書籍や雑誌)の書誌情報項目を示す.
  • series 書籍または他の書誌項目のシリーズに関する情報を示す.

TEIでは,雑誌や作品集は,単刊物として扱う. 従って,雑誌にはタイトルがあり,それは要素 title level="j"または要素 monogrの中で要素 title を使い記録される. 雑誌やテキストのコレクションにある個々の作品は,分析的レベ ルで記録すべきである. 複数の雑誌またはコレクションに同じ作品が掲載された場合に は,複数の要素monogrと,それに続く複数の要素series を使い,記録することができる. 要素seriesは,常に,直近の要素 monogrと関連することになる (再版された作品に,統一した1つの書誌情報を付与するか,それ ぞれに書誌情報を付与するかは,スタイルの違いである. この場合,図書館では,個別に書誌情報を与えているが,学術論 文などでは,単一のものとして扱うのが普通である.)

例えば,ある作品が,ひとつは雑誌として,ひとつはドイツ語版 のコレクションとして出版されている場合,以下のように記録す ることができる.
<biblStruct>
 <analytic>
  <author>Thaller, Manfred</author>
  <title level="a">A Draft Proposal for a Standard for the
     Coding of Machine Readable Sources</title>
 </analytic>
 <monogr>
  <title level="j">Historical Social Research</title>
  <imprint>
   <biblScope type="vol">40</biblScope>
   <date>October 1986</date>
   <biblScope type="pages">3-46</biblScope>
  </imprint>
 </monogr>
 <monogr>
  <title level="m">Modelling Historical Data:
     Towards a Standard for Encoding and
     Exchanging Machine-Readable Texts</title>
  <editor>Daniel I. Greenstein</editor>
  <imprint>
   <pubPlace>St. Katharinen</pubPlace>
   <publisher>Max-Planck-Institut für Geschichte
       In Kommission bei
       Scripta Mercaturae Verlag</publisher>
   <date>1991</date>
  </imprint>
 </monogr>
 <series xml:lang="de">
  <title level="s">Halbgraue Reihe
     zur Historischen Fachinformatik</title>
  <respStmt>
   <resp>Herausgegeben von</resp>
   <name type="person">Manfred Thaller</name>
   <name type="org">Max-Planck-Institut für Geschichte</name>
  </respStmt>
  <title level="s">Serie A: Historische Quellenkunden</title>
  <biblScope>Band 11</biblScope>
 </series>
</biblStruct>

収録レベルと単刊レベルでの記録は,ひとつの引用中に収めるか, 別の作品中に収めるかで区別されるべきである. これは,符号化する人が,ある種の基準で,判断することになる. 詳細は,3.11.2.5 関連項目を参照のこと.

構造化された書誌項目の間に句点は入力されるべきではない. 但し,要素を区切る働きを持つものは例外である. 先の例にあるように,要素と要素の間に句点を含まず,書誌項目を記録 することは可能である. これは,要素biblStructを使うことで,可能となる. これにより,様々なスタイルの書誌参照を記録することができる.

3.11.2.2 著者,タイトル,編集者
書誌情報の参照は,一般には,そのタイトルと,続いてその著者名 が記された形式をとることになる. コレクションや雑誌中の作品への書誌参照では,収録レベルと単刊 レベルの双方の情報を示す必要がある. 以下にある要素は,この様な場合に使われるものである.
  • title 作品の完全なタイトルを示す.
  • author 書誌情報における,著作者(個人・団体)の名前を示す.書誌項 目における責任者を示す第一位の記述を示す.
  • editor 書誌情報における,第二位の責任者を示す.個人,団体,組織, 編集者,編纂者,翻訳者の名前など.
  • respStmt 著者や編集者など特定の役割を示す要素が充分ではない場合 に,テキスト,版,記録などの知的内容に関する責任を示す.
  • resp 人物の知的責任の性質を表す一節を示す.
  • name 固有名詞.
  • meeting 会議中の項目を書誌情報で記述する際や,発行物の見出しや序 文に現れる,会合や会議を表す,形式化された記述的タイトルを示す.
要素authorと,editorrespStmtは,要素 biblの内容となるクラスmodel.biblPartの下位クラ スであるmodel.respLike のメンバーである.
書誌参照では,タイトルは,収録タイトル,単刊タイトル,シリー ズタイトルのいずれかで記録される. ひとつの要素titleで,この3種類のタイトルを記録することが できる. 要素analyticや,monogrseries を使うときにも,このどのレベルでも要素titleは使うことができる. どのレベルでも使うことができるが,属性levelで所属するレベルは記録されるべきであ る. 属性levelの値に,内容に合わないレベ ルを与えることは,意味上のエラーとなる. この場合,その値は無視されるかもしれない. 属性levelの値がaの時,これは,収録レベルを示している. 値がmまたはjまたはuの時,こ れらは単刊レベルを示している. 値がsの時,これはシリーズレベルを示 している. 但し,意味上のエラーは,入れ子化されたタイトルが,要素 analyticmonogrseriesの子要素として使われた場合に のみ起こりうる. そうでないときに,意味上のエラーは起きない. 例えば,収録タイトルに,単刊のタイトルを含むことは可能である.
<biblStruct>
 <analytic>
  <author>Lucy Allen Paton</author>
  <title>Notes on Manuscripts of the
  <title level="mxml:lang="fr">Prophécies de Merlin</title>
  </title>
 </analytic>
 <monogr>
  <title level="j">PMLA</title>
  <imprint>
   <biblScope type="vol">8</biblScope>
   <date>1913</date>
   <biblScope type="pages">122</biblScope>
  </imprint>
 </monogr>
</biblStruct>
この例では,収録タイトルの「‘Notes on Manuscripts of the Prophécies de Merlin’」には,属性 level
は必要ない. その理由は,要素analyticの直接の子要素になって いるからである. この中に含まれている単刊レベルのタイトル「Prophéciesde Merlin」 は,意味的なエラーを起こさない. その理由は,要素analyticの直接の子要素にはなっていないか らである.

書誌情報を扱うソフトによっては,メインタイトルと,下位のタイト ルや別タイトルを分けた方がよい場合もある. この様な場合,属性typeを使い,それを 区別することができる.

以下にある例は,収録レベルにある主タイトルと副タイトルを分け ている記述である. ここでは,要素biblStructよりも,より自由に使える要素biblを使って いることに注意して欲しい. その結果,書誌参照の全ての項目(例えば,作者情報)を書く必要はな くなっている.
<bibl>Saarikoski, Pirkko-Liisa, and Paavo Suomalainen,
<title level="atype="main">Studies on the physiology of
   the hibernating hedgehog, 15</title>
 <title level="atype="subordinate">Effects of seasonal
  and temperature changes on the in vitro glycerol release from
   brown adipose tissue</title>
 <title level="j">Ann. Acad. Sci. Fenn., Ser. A4</title>
 <date>1972</date>
 <biblScope type="vol">187</biblScope>
 <biblScope type="pp">1-4</biblScope>
</bibl>
少し複雑な例として,先の例と同じ資料(p.63)で,主タイトル, 下位タイトル,別タイトルを分ける場合を考えてみる. 書誌情報の記述方法は,ANSI Z39.29-1977に従っている. また,ISBD(国際標準書誌記述)にも従っている. 16 以下の例では,要素biblStructではなく,要素biblを使っているので,参照情報を構 成する要素の間に,特定の句点を使えることに注意して欲しい.
<bibl>Tchaikovsky, Peter Ilich.
<title level="mtype="main">The swan lake ballet</title>
= <title level="mtype="parallelxml:lang="fr">Le lac des cygnes</title>
: <title level="mtype="subordinatexml:lang="fr">grand ballet en 4 actes</title>
: <title level="mtype="subordinate">op. 20</title>
[Score].
New York: Broude Brothers; [1951] (B.B. 59). vi, 685 p.</bibl>

印刷された書籍や論文にとって, 要素authorや要素editorは,重要である. これに比べれば,他の書誌項目の重要性は,落ちるかもしれない. 要素authorは,当該作品の知的内容に責任を持つ 人物または団体を記録するために使われるべきである. 要素editorは,当該作品の編集者を記 録するために使われるべきである. 例えば,ラジオ局やテレビ局のような団体も,通常は「著者」と見な される. また,国家が発行する報告書の「著者」には,通常は,それを制作し た部局が該当する.

当該作品に何らかの責任を持つ人物は,要素respStmt に記録されるべきである. この時,責任の性質は,要素respに記録され,人物・団体などは,要素 nameまたは persNameまたはorgNameに記録される. 要素rsは,文 字列「unknown」をとることがある. 要素respStmtの中には, 4つの要素namepersNameorgNamersのうちから少なくとも1つの要素と,1 つの要素respをとるべきで,これに続けて選択的 に要素をとることができる.

2次的な責任者の例としては,イラストレータ,翻訳者,符号化する 人,注釈を記入する人などがある. 要素respStmtは,編集者について,その役割など を特定の用語で記録したい時に,使うことができる.

要素authorと要素editorの使用例は,3.11.1 書誌参照や, 3.11.2.1 収録,単刊,シリーズにある. 要素authorや要素editorが使われるときには,要素 respStmtも使うことができる. これらのうち1つの要素がタイトルに先行して記録されている場合に は,当該要素は,このタイトルに関する記録となる. また,これらのうち1つの要素に続いて,要素editionが 記録されていたり,これらが版ステートメントの中で使われている場 合には,その版に関する記録となる.

以下の例では,要素respStmtは,当該作品の全てに関するもので あり,第1版にのみ関する記録ではない.
<bibl>
 <author>Lominadze, D. G.</author>
 <title level="m">Cyclotron waves in plasma.</title>
 <respStmt>
  <resp>translated by</resp>
  <name>A. N. Dellis;</name>
 </respStmt>
 <respStmt>
  <resp>edited by</resp>
  <name>S. M. Hamberger.</name>
 </respStmt>
 <edition>1st ed.</edition>
 <pubPlace>Oxford:</pubPlace>
 <publisher>Pergamon Press,</publisher>
 <date>1981.</date>
 <extent>206 p.</extent>
 <title level="s">International series in natural philosophy.</title>
 <note place="inline">Translation of:
 <title xml:lang="rulevel="m">Ciklotronnye volny v plazme.</title>
 </note>
</bibl>
これに対して,以下の例では,要素respStmt は,この版のみに関する記録であり,コレクション全体に関するもの ではない(つまり,Hugo MoserとHelmut Tervoorenは,1版35刷に責任 は持たない). 従来,書誌参照を構成する要素は,各巻のタイトルページから抽出さ れてきた. これにより,コレクションのタイトル,版情報,責任情報が正しく記 録されてきた.
<biblStruct>
 <monogr xml:lang="de">
  <title>Des Minnesangs Frühling</title>
  <note place="inline">Mit 1 Faksimile</note>
  <edition>36., neugestaltete und erweiterte Auflage</edition>
  <respStmt>
   <resp>Unter Benutzung der Ausgaben von <name>Karl
        Lachmann</name> und <name>Moriz Haupt</name>, <name>Friedrich
         Vogt</name> und <name>Carl von Kraus</name> bearbeitet von</resp>
   <name>Hugo Moser</name>
   <name>Helmut Tervooren</name>
  </respStmt>
  <imprint>
   <biblScope type="volume">I Texte</biblScope>
   <pubPlace>Stuttgart</pubPlace>
   <publisher>S. Hirzel Verlag</publisher>
   <date>1977</date>
  </imprint>
 </monogr>
</biblStruct>
学会やワークショップなどで発表された作品では,責任の記録の仕方 は少し異なっている. 要素meetingを使い,以下のように,記録することがで きる.
<biblStruct>
 <monogr>
  <title>Proceedings of a workshop on corpus resources</title>
  <respStmt>
   <resp>Programme Organizer</resp>
   <name>Geoffrey Leech</name>
  </respStmt>
  <meeting>DTI Speech and Language Technology Club meeting, 3-4
     January 1990, Wadham College, Oxford</meeting>
 </monogr>
</biblStruct>
3.11.2.3 刊記やページなど
刊記(または奥付)(imprint)と は,作品の出版に関するあらゆる情報を示すものである. 例えば,書籍などを(営利目的または他の目的で)公開・頒布した責 任を持つ人物や団体やその名称,出版地,日付などの情報である. 出版者や団体に関する詳細な住所が記されていることもある. 一般に,詳細な書誌情報では,印刷物のページ総数(非印刷物の場 合は,それに相当する情報)や,出版物の中で引用されている資料 の所在についても記録されている. 以下にある要素は,以上のような情報を記録するためのものである.
  • imprint 書誌情報の対象となるものの,出版に関する情報を示す.
  • address 郵便配達情報を示す.例えば,出版者,組織,個人の住所など.
  • pubPlace 書誌項目が出版された場所の名前を示す.
  • publisher 書誌項目の出版や頒布に責任のある団体の名前を示す.
  • date 日付を示す.
  • idno 書誌項目を特定する標準的・非標準的数値を示す.
  • extent 電子・非電子テキストのおよその大きさを任意の単位で示す.
  • biblScope 書誌情報の参照範囲を示す.例えば,ページ番号,下部単位の名前など.
要素biblScopeと,要素pubPlaceと,要素publisherは,クラスmodel.imprintPartを構 成している. このクラスのメンバーは,クラスbiblStructのメンバーである要素imprintにおいて,使われる. または,要素biblにおいて,他の書誌情報と共に使われ る.

一般には,書誌情報では出版地が必要で,詳細な住所ではなく,地 域の名前が記録される. この種の情報は,要素pubPlaceで記録される. 書誌項目を特定するために,詳細な住所が必要な場合には, 3.5.2 住所 で解説する要素addressで記録することになる. または,3.5.1 参照文字にある, 要素rsや, 要素name で記録することも可能である. この場合,記録される情報は,詳細な住所でも都市名でもよい.

当該出版物が一般的な出版者ではない団体から発行された場合, 書誌項目の出版者名は,要素publisherで記録すべきである. 例えば,以下は,技術報告書の例である.
<biblStruct>
 <monogr>
  <author>Nicholas, Charles K.</author>
  <author>Welsch, Lawrence A.</author>
  <title>On the interchangeability of SGML and ODA</title>
  <imprint>
   <pubPlace>Gaithersburg, MD</pubPlace>
   <publisher> National Institute of Standards and Technology
   </publisher>
   <date when="1992-01">January 1992</date>
  </imprint>
  <extent>19 pp.</extent>
 </monogr>
 <idno type="NIST">NISTIR 4681</idno>
</biblStruct>
以下は,博士論文の例である.
<biblStruct>
 <monogr>
  <author>Hansen, W.</author>
  <title level="u">Creation of hierarchic text
     with a computer display</title>
  <note place="inline">Ph.D. dissertation</note>
  <imprint>
   <publisher>Dept. of Computer Science, Stanford Univ.</publisher>
   <pubPlace>Stanford, CA</pubPlace>
   <date when="1971-06">June 1971</date>
  </imprint>
 </monogr>
</biblStruct>
書誌項目が,再版の場合,とりわけ,以前の版と違いなく印刷された 場合には,要素imprintや再版に関連する要素と共に, 要素monogrを使って記録される. 以下は,タイトルや著者情報に変更がない,マイクロフィルム 版としての再版の例である. 例にあるシリーズの情報は,2番目の要素monogrにの み関連している.
<biblStruct>
 <monogr>
  <author>Shirley, James</author>
  <title type="main">The gentlemen of Venice</title>
  <title type="subordinate">a tragi-comedie presented at the private
     house in Salisbury Court by Her Majesties servants</title>
  <note place="inline">[Microform]</note>
  <imprint>
   <pubPlace>London</pubPlace>
   <publisher>H.Moseley</publisher>
   <date>1655</date>
  </imprint>
  <extent>78 p.</extent>
 </monogr>
 <monogr>
  <imprint>
   <pubPlace>New York</pubPlace>
   <publisher>Readex Microprint</publisher>
   <date>1953</date>
  </imprint>
  <extent>1 microprint card, 23 x 15 cm.</extent>
 </monogr>
 <series>
  <title>Three centuries of drama: English, 1642–1700</title>
 </series>
</biblStruct>

上記の例を,別の方法で記録する方法として, 3.11.2.5 関連項目で解説す る要素relatedItemを使う方法もある.

書誌情報の中でも,特に収録タイトルには,所在を特定する付加的な 情報が含まれることがある. 例えば,巻番号,ページ番号,ページの範囲,上位項目から見た下位 番号などである. この様な場合,要素biblScopeを使うことができる. このような付加的な情報(巻番号,ページ番号,章番号など)の分類を 分けるときには,属性typeを使い,任意 の分類が可能である.

書誌項目が,雑誌にある論文中で引用されているものである場合,要 素imprintを使い,要素dateや,巻番 号やページ番号を記録できる要素biblScopeと共に,記録することができる.

例えば,以下のようになる.
<biblStruct>
 <analytic>
  <author>Wrigley, E. A.</author>
  <title>Parish registers and the historian</title>
 </analytic>
 <monogr>
  <editor>Steel, D. J.</editor>
  <title>National index of parish registers</title>
  <imprint>
   <pubPlace>London</pubPlace>
   <publisher>Society of Genealogists</publisher>
   <date when="1968">1968</date>
   <biblScope type="vol">vol. 1</biblScope>
   <biblScope type="pp">pp. 155–167.</biblScope>
  </imprint>
 </monogr>
</biblStruct>
要素biblScopeにある属性typeは,選択的である. 以下にある2つの例は,共に正しい書き方である.
<biblStruct>
 <analytic>
  <author>Boguraev, Branimir</author>
  <author>Neff, Mary</author>
  <title>Text Representation, Dictionary Structure,
     and Lexical Knowledge</title>
 </analytic>
 <monogr>
  <title level="j">Literary &amp; Linguistic Computing</title>
  <imprint>
   <biblScope type="vol">7</biblScope>
   <biblScope type="issue">2</biblScope>
   <date>1992</date>
   <biblScope type="pp">110-112</biblScope>
  </imprint>
 </monogr>
</biblStruct>
<biblStruct>
 <analytic>
  <author>Chesnutt, David</author>
  <title>Historical Editions in the States</title>
 </analytic>
 <monogr>
  <title level="j">Computers and the Humanities</title>
  <imprint>
   <biblScope>25.6</biblScope>
   <date when="1991-12">(December, 1991):</date>
   <biblScope>377–380</biblScope>
  </imprint>
 </monogr>
</biblStruct>
3.11.2.4 シリーズ情報

シリーズ情報は,要素seriesStmtを使い, 要素biblの元で(また,要素biblFullの元では必須の情報として) 記録することができる. または,(要素biblFullの元では)要素seriesStmtに記録することができる. シリーズタイトルは,要素title level="s"に,巻番号は,要素biblScope type="vol"に, 当該シリーズの責任情報(例えば, 3.11.2.1 収録,単刊,シリーズにある例 の編集者の名前や所属)などは,要素editorまたは要素respStmtに記録することができ る.

3.11.2.5 関連項目

書誌情報の専門用語としてある「関連項目」とは,当該定義された 書誌項目と関連している対象を示すものである. 先に見た収録項目と単刊項目の違いは,この「関連項目」の特殊な 関係とも考えることができる. しかし,一般には,関連項目としては,例えば,翻訳,続巻,元資 料,断片などが該当する.

要素relatedItemは,そのような関連した書誌 項目を記録するためのものである.
  • relatedItem 当該内容と関連する書誌情報項目を示す,または参照する. 例えば,構成要素または他の版など.
以下にある例では,最初の要素biblStructにはファクシミリ版が,2番目にはそ の元になった作品を記録したものである. ファクシミリ版とその元資料との関係は,始めの記述中にある 要素relatedItemに記録されている. この中では,元資料に関する記述への参照が記録されている.
<biblStruct xml:id="bibl03">
 <monogr>
  <author>Swinburne, Algernon Charles</author>
  <title>Swinburne's <title>Atalanta in Calydon</title>: A Facsimile of the
     First Edition</title>
  <editor>Georges Lafourcade</editor>
  <imprint>
   <pubPlace>London</pubPlace>
   <publisher>Oxford UP</publisher>
   <date>1930</date>
  </imprint>
 </monogr>
 <relatedItem type="original">
  <ref target="#bibl04"/>
 </relatedItem>
</biblStruct>
<biblStruct xml:id="bibl04">
 <monogr>
  <author> Swinburne, Algernon Charles</author>
  <title>Atalanta in Calydon</title>
  <imprint>
   <pubPlace>London</pubPlace>
   <publisher>Edward Moxon</publisher>
   <date>1865</date>
  </imprint>
 </monogr>
</biblStruct>
この例にある要素refは,要素biblStructと入れ替えることも可能である. その理由は,要素relatedItemは,各種の書誌参照に関す る要素をとることができるからである. 例えば,先の例は,以下のようにも記録することができる.
<biblStruct>
 <monogr>
  <author>Shirley, James</author>
  <title type="main">The gentlemen of Venice</title>
  <imprint>
   <pubPlace>New York</pubPlace>
   <publisher>Readex Microprint</publisher>
   <date>1953</date>
  </imprint>
  <extent>1 microprint card, 23 x 15 cm.</extent>
 </monogr>
 <series>
  <title>Three centuries of drama: English, 1642–1700</title>
 </series>
 <relatedItem type="original">
  <biblStruct>
   <monogr>
    <author>Shirley, James</author>
    <title type="main">The gentlemen of Venice</title>
    <title type="subordinate">a tragi-comedie presented at the private
         house in Salisbury Court by Her Majesties servants</title>
    <imprint>
     <pubPlace>London</pubPlace>
     <publisher>H. Moseley</publisher>
     <date>1655</date>
    </imprint>
    <extent>78 p.</extent>
   </monogr>
  </biblStruct>
 </relatedItem>
</biblStruct>
3.11.2.6 注釈など
一般的ではない対象(例えば,スコアやマイクロフィルム)の出版に 関する注釈や来歴(例えば,どれを底本とした翻訳など)の情報は, 要素noteに記録することができる. この要素は,データベース中にある書誌項目に,記述的なアノテー ションを付加する際にも使うことができる.
  • note 注釈・コメント.
例えば,以下のようになる.
<bibl>
 <author>Coombs, James H., Allen H. Renear,
   and Steven J. DeRose.</author>
 <title level="a">Markup Systems and the Future of Scholarly
   Text Processing.</title>
 <title level="j">Communications of the ACM</title>
 <biblScope>30.11 (November 1987): 933–947.</biblScope>
 <note>Classic polemic supporting descriptive over procedural
   markup in scholarly work.</note>
</bibl>
3.11.2.7 書誌項目の順序

要素biblの下位要素には,その出現 順序に制限はない.

要素biblStructの下位要素には, 要素analyticが(使われるときには)最初に 出現し,続いて要素 monogr と要素seriesを複数とることができる. この2つの要素は(要素monogrが先行しながら)混ざって出現す ることができる. 要素analyticの下位要素には,タイトル,著 者,編集者,他の責任者に関する情報が,任意の順番で記録される. 但し,タイトル情報は必ず記録されることが推奨されている. 要素monogrの下位要素には,著者,編集 者,責任者に関する情報が,一番始めに,または単刊のタイト ルに続いて,記録される. 以下の要素は,ここで示す順番で,出現することになる.
  • 要素noteには,出版に関する情報が(要素meetingには,論文集の場合,会議に 関する情報)が記録される.
  • 要素editionには,関連する要素editorまたは要素respStmtが続く.
  • 要素imprint
  • 要素biblScope
要素imprintの下位要素は,以下の順番で,出 現する.

要素biblStructにある要素seriesの下位要素には,出現順序に制 約はない.

書誌記述に関するより詳細は構造は,要素biblFullに記録されるべきである. これについては,本節では詳細を解説しない. 記録される内容は,要素teiHeader中にある要素fileDescに記録されるものと同等である. この詳細は,2.2 ファイル解説にある.

3.11.3 書誌ポインタ

書誌項目へのポインターとなっている参照は,どのようなものであ れ,相互参照として扱うべきである(3.6 簡単なリンクと相互参照を参照). 先の節でも解説したとおり,TEIでは相互参照を要素ptrまたは要素refで記述す ることになる. この2つの要素は,属性targetを使い, 相互参照の対象を記録することができる. そのような対象としては,例えば,書誌情報であれば,各種の書誌 参照が該当する. 当該参照の形式自体は重要でない,または自動的に再構成可能であ り,あえて記録するような対象でない場合には,例えば以下のよう に,要素ptrを使うことができる.
As shown above (<ptr target="#NEL80"/>) ...
参照の形式自体が重要である,または周囲のテキストとは異なる付加 的な情報がある場合には,要素refを使い,以下のように記録すべきで ある.
Nelson claims <ref target="#NEL80">(ibid, passim)</ref> ...
簡易型の書誌参照と,付加的な情報などを分けることに意義があることも ある. この場合,付加的な情報などは,要素refの記録対象とすべきではない. 下の例のように,正規化された書誌参照のみ記録されることになる.
Nelson claims (<ref target="#NEL80">Nelson [1980]</ref> pages 13–37) ...

3.11.4 他の書誌スキームとの関連

ここで紹介する書誌情報の項目は,多くの書誌情報の記録方式で も,独立したものとされている. 以下にあるリストの項目は,一般的なシステムを利用する場合に有 効で,例えば,主な書誌情報のシステム,Scribeや BibTeX,ProCiteにも対応するものがある.

以下のリストは,ScribeとBibTeXで定義されている書誌情報項目 と,本モジュールで定義される項目との対応関係をまとめたもので ある. 17 当モジュールにある要素のうち,ScribeやBibTeXとの対応がない ものについては,載せていない.
address
要素city(訳注:原文のまま), placeaddressに対応.
annote
要素noteに対応.
author
要素authorに対応.
booktitle
要素title level="m"や, 要素monogr内の要素 titleに対応.
chapter
要素biblScope type="chapter" に対応.
date
書誌データベースに登録された日付を記録するもの.対応す るものはない.
edition
要素editionに対応.
editor
要素editorrespStmtに対応.
editors
複数の要素editorrespStmtに対応.
fullauthor
属性reg(訳注:原文のまま),要 素authornameに対応.
fullorganization
要素name type="org"の属性 regに対応(訳注:原文のまま).
howpublished
要素noteに対応. note place="inline"のように書 ける.
institution
技術レポートの発行者を記録する. 要素publisherに対応.
journal
要素title level="j"や,要素monogr内の要素titleに対応.
key
書誌項目の並べ替えキーを示す. 著者や編集者の名前に代わるもの. これに対応するものは(TEIには)ない.
meeting
要素meeting,要素noteに対応.
month
要素dateに対応. この要素が,処理可能な書式ではない場合,属性 whenに, XML Schema Part 2: Datatypes Second Edition に準拠した,正規化されたデータが記録される.
note
要素noteに対応する.
number
要素biblScope type="issue", 要素biblScope type="number"に 対応する. 技術報告書の番号には,要素idnotype="docno"が対応する.
organization
会議の後援者を記録するもの. 要素meeting内の要素respStmtの中にある要素name type="org"が対応する.
pages
要素biblScope type="pp"に対応.
publisher
要素publisherに対応.
school
作品が作られた団体を示す. 要素publisherに対応.
series
要素title level="s"や, 要素series内の要素titleに対応.
title
関連する文脈中,または属性levelに適切な値と伴う要素titleに対応.
volume
要素biblScope type="vol"に対 応.
year
要素dateに対応. この日付が,処理可能な書式ではない場合,属性valueに,ISO準拠の値が記録される.

3.12 韻文・舞台芸術中の一節

以下にある要素は,散文や韻文,舞台芸術向けのテキストなどが, 混在しているテキストを符号化するために, コアモジュールで用意されたものである.
  • l 韻文中の1行を示す.行として完全でない場合もある.
  • lg 形式単位としてある,ある韻文の行をまとまりを示す.例え ば,連,リフレイン,詩節など.
  • sp 演技テキストまたは韻文・散文中にある個々の発話を示す.
  • speaker 舞台関連の文章に出てくる1人以上の発話者の名前を示す.見 出しやラベル として書かれる.
  • stage 舞台芸術テキスト中にある,ト書き相当を示す.

韻文や舞台芸術向けのテキストのそれぞれで使われる要素について は,それぞれ別の章で詳しく解説してある(韻文については 6 韻文を参照のこと.ま た,舞台芸術向けテキストについては, 7 Performance Textsを参照のこと.). 本節では,上記の要素のみを解説する. これらは,散文,韻文,舞台芸術向けテキストのいずれにおいても 使うことができる.

3.12.1 韻文向けコア要素

韻文におけるテキストや詩は,他のテキストと同様に,階層構造 を作ることができる. 例えば,書籍や編などである. この様な構成要素には, 4 テキスト構造モジュール 6 韻文で解説するよう に,一般用途向けの要素divや,要 素div1 等を使った方がよい. 韻文を構成する基本単位は,段落ではなく,「行」となる.

要素lを使 い,韻文の行を記録することができる. この時の「行」とは,印刷におけるものではなく,韻律上のもの である. 現代の韻文においては,印刷上の行を韻文上の行と見なすべきか どうかを判断することが難しい場合がある. 但し,それでも,この区別は,以下に厚ような韻律パタンの規則 に従う限りは,明確なものである. 韻律上の行が,印刷上の改行と一致している場合には,符号化す る人は,このような違いを意識する必要はなく, 3.10 参照システムで解 説する空要素 lbを使い,記録 することもできる. 一般に,韻文行の始まりは,印刷上の始まりの行にもなっている. 従って,要素lの前に,要素 lbを記す必要性 はない. 但し,韻律の行中で,新しい印刷の行が始まる場合には,以下の ように記録することができる.
<l>Of Mans First Disobedience, and<lb/> the Fruit</l>
<l>Of that Forbidden Tree, whose<lb/> mortal tast</l>
<l>Brought Death into the World,<lb/> and all our woe,</l>
<l>With loss of Eden, till one greater Man</l>
<l>Restore us, and regain the blissful Seat...</l>
この例では,元資料テキストにある,詩の始めに置かれが装飾大文字 により,韻文上の始めの4行が,印字上の4行には十分な幅が取れなかっ たことが示されている. 韻文上の1行が,印字上では改行を挟み,2行で示されているところがある. この様な符号化方法は,行と関連する空白文字やインデントを保持す ること目的としたものではないことに注意して欲しい. これらが重要な情報である場合には,1.3.1.1 グローバル属性で解説する要素rendや要素renditionに記録される.

要素lは,韻 文ではない資料の,印刷上の行を記録するためには,使うべきでは ない. 散文中での改行の場所が,分析上,重要と思われる際には,要素lbに記録されるべきであ る. または,要素segや要素abといった,一般的な区分を示す要素に記 録することもできる. これらの詳細は,16 リンク,分割,統合にある. 要素lは,ク ラスmodel.lLikeのメンバー である. このクラスは,クラスmodel.pLikeと共に, クラスmodel.divPartの下位クラスである.

韻文の中には,行をまとめる決まった単位があり,それは,韻文ス キーマとして定義されている. 行から成る詩や二行連句など,行単位のまとまりは,いわゆる段落 に相当し,通常はインデントにより(その始まりが)示される. 韻文の中には,空白で示された,とくに数の決まりはなく,一連の 行をまとまりとするものもある. 要素lgは, 行のまとまりを示すもので,クラスmodel.lLikeに所属する要素を まとめるために使うことができる. 要素lgは, クラスatt.typedのメンバーと して,以下の属性をとることができる.
  • att.typed 要素を分類するための属性を示す.
    type 当該要素の分類を示す.
    subtype 必要であれば,当該要素の下位分類を示す.
これらの属性は,行のまとまりに,より詳細な分類を記録したいと きに,例えば,以下にある例のように,使うことができる. この例では,属性rendにより,行がイ ンデントされているかどうかが,記録されている.
<lg>
 <l>Come fill up the Glass,</l>
 <l rend="indent">Round, round let it pass,</l>
 <l>'Till our Reason be lost in our Wine:</l>
 <l rend="indent">Leave Conscience's Rules</l>
 <l rend="indent">To Women and Fools,</l>
 <l>This only can make us divine.</l>
</lg>
<lg n="Chorustype="refrain">
 <l>Then a Mohock, a Mohock I'll be,</l>
 <l>No Laws shall restrain</l>
 <l>Our Libertine Reign,</l>
 <l>We'll riot, drink on, and be free.</l>
</lg>
分析の目的によっては,同じ韻文中でも,行のまとまりの種類の違い を示しておいた方がよい事もある. このような場合,行のまとまりを,4 テキスト構造モジュールで解 説する要素divと同じように,入れ子化することもでき る. 例えば,以下のようになる.
<lg type="sonnet">
 <lg type="octet">
  <l>Thus speaks the Muse, and bends her brow severe:—</l>
  <l>“Did I, <name>Lætitia</name>, lend my choicest lays,</l>
  <l>And crown thy youthful head with freshest bays,</l>
  <l>That all the' expectance of thy full-grown year</l>
  <l>Should lie inert and fruitless? O revere</l>
  <l>Those sacred gifts whose meed is deathless praise,</l>
  <l>Whose potent charms the' enraptured soul can raise</l>
  <l>Far from the vapours of this earthly sphere!</l>
 </lg>
 <lg type="sestet">
  <l>Seize, seize the lyre! resume the lofty strain!</l>
  <l>'T is time, 't is time! hark how the nations round</l>
  <l>With jocund notes of liberty resound,—</l>
  <l>And thy own <name>Corsica</name> has burst her chain!</l>
  <l>O let the song to <name>Britain's</name> shores rebound,</l>
  <l rend="indent(-1)">Where Freedom's once-loved voice is heard,
     alas! in vain.”</l>
 </lg>
</lg>
韻文における行の境界と,他の構造要素の境界とが,かち合うことは よくあることである. 例えば,以下にある例では,‘A Workeman in't... welcomeという韻 文中の行が,ト書きとして解釈されている.
<l>Thou fumblest <name>Eros</name>, and my Queenes a Squire</l>
<l>More tight at this, then thou: Dispatch. O Loue,</l>
<l>That thou couldst see my Warres to day, and knew'st</l>
<l>The Royall Occupation, thou should'st see</l>
<l part="I">A Workeman in't. <stage>Enter an Armed Soldier.</stage>
</l>
<l part="F">Good morrow to thee, welcome. </l>
この例では,属性part が,あたかも要素divのように,最後にある2つの要素lが,2つの独立し た行ではなく,1つの行を構成する始めと終わりの部分であることが記録 されていると,解釈されるべきである.
これと同じようなテクニックは,韻文の行がまとまり,韻文上の段落 を構成しているような単位を記録する場合にも,使うことができる.
<lg n="6type="para">
<!-- ... -->
 <l>Unprofitably travelling toward the grave,</l>
 <l>Like a false steward who hath much received</l>
 <l part="I">And renders nothing back.</l>
</lg>
<lg type="paran="7">
 <l part="F">Was it for this</l>
 <l>That one, the fairest of all rivers, loved</l>
 <l>To blend his murmurs with my nurse's song,</l>
<!-- ... -->
</lg>
属性partは,要素lgとも,共に使 うことが可能で,当該lgの内容が,まだ完結していないことを示して いる. 例えば,1つの部分が,2人の話し手で語られる場合は,以下のように 記録することができる.
<sp>
 <speaker>First Voice</speaker>
 <lg type="stanzapart="I">
  <l>But why drives on that ship so fast</l>
  <l>Withouten wave or wind?</l>
 </lg>
</sp>
<sp>
 <speaker>Second Voice</speaker>
 <lg type="stanzapart="F">
  <l>The air is cut away before,</l>
  <l>And closes from behind.</l>
 </lg>
</sp>

行のまとまりを,単純な階層構造とはならない,または非連続的なも のとして結びつける方法については,16 リンク,分割,統合で解説する. 韻文の符号化に関する他の要素や属性については,6 韻文で解説する.

3.12.2 舞台芸術向けコア要素

他のテキストと同様に,舞台芸術のテキスト,例えば,映画やドラ マの脚本などにも,文書構造がある. 例えば,幕や場などである. この様な構造単位は,4 テキスト構造モジュールや, 7 Performance Textsで解 説する,一般的な区分を示す要素divや要素 div1など を使い,記録すべきである. これらの要素の中で,舞台芸術テキストの本文を構成する「発話」 が記録される. 発話は,その話者を示す句や,時には,各種のト書きが伴うことも ある.

以下の例では,1つの形式段落で1つの発話が示されている.
<div2 n="I.2type="scene">
 <head>Scene 2.</head>
 <stage type="setting">Peachum, Filch.</stage>
 <sp>
  <speaker>FILCH.</speaker>
  <p>Sir, Black Moll hath sent word her Trial comes on in
     the Afternoon, and she hopes you will order Matters
    so as to bring her off.</p>
 </sp>
 <sp>
  <speaker>PEACHUM.</speaker>
  <p>Why, she may plead her Belly at worst; to my
     Knowledge she hath taken care of that Security.
     But, as the Wench is very active and industrious,
     you may satisfy her that I'll soften the Evidence.</p>
 </sp>
 <sp>
  <speaker>FILCH.</speaker>
  <p>Tom Gagg, sir, is found guilty.</p>
 </sp>
</div2>
以下の例では,発話は,複数の韻文行から構成されている. また,それらのいくつかは,単体では韻律上不完全であることが示されている.
<div1 n="Itype="Act">
 <head>ACT I</head>
 <div2 n="1type="Scene">
  <head>SCENE I</head>
  <stage rend="italic">Enter Barnardo and Francisco,
     two Sentinels, at several doors</stage>
  <sp>
   <speaker>Barn</speaker>
   <l part="Y">Who's there?</l>
  </sp>
  <sp>
   <speaker>Fran</speaker>
   <l>Nay, answer me. Stand and unfold yourself.</l>
  </sp>
  <sp>
   <speaker>Barn</speaker>
   <l part="I">Long live the King!</l>
  </sp>
  <sp>
   <speaker>Fran</speaker>
   <l part="M">Barnardo?</l>
  </sp>
  <sp>
   <speaker>Barn</speaker>
   <l part="F">He.</l>
  </sp>
  <sp>
   <speaker>Fran</speaker>
   <l>You come most carefully upon your hour.</l>
  </sp>
  <sp>
   <speaker>Barn</speaker>
   <l>'Tis now struck twelve. Get thee to bed, Francisco.</l>
  </sp>
  <sp>
   <speaker>Fran</speaker>
   <l>For this relief much thanks. 'Tis bitter cold,</l>
   <l part="I">And I am sick at heart.</l>
  </sp>
 </div2>
</div1>
例えば,シェークスピアの原稿である四折版 「Hamlet」において,印刷されている 話し手の情報は,属性whoで示すことがで きる. この時,各行には,それが完結した発話かまたはそうでないかを記録 することができる.
<stage>Enter two Centinels.
<add place="right">Now call'd <name xml:id="barnardo">Bernardo</name> &amp;amp;
 <name xml:id="francisco">Francesco</name>.</add>
</stage>
<sp who="#francisco">
 <speaker>1.</speaker>
 <l part="Y">STand: who is that?</l>
</sp>
<sp who="#barnardo">
 <speaker>2.</speaker>
 <l part="Y">Tis I.</l>
</sp>
<sp who="#francisco">
 <speaker>1.</speaker>
 <l>O you come most carefully vpon your watch,</l>
</sp>
<sp who="#barnardo">
 <speaker>2.</speaker>
 <l>And if you meete Marcellus and Horatio,</l>
 <l>The partners of my watch, bid them make haste.</l>
</sp>
<sp who="#francisco">
 <speaker>1.</speaker>
 <l part="Y">I will: See who goes there.</l>
</sp>
<stage>Enter Horatio and Marcellus.</stage>
初期印刷板を符号化する際に,韻文と散文を分けずに記録する場合, 例えば,以下のようになる.
<div1 n="Itype="act">
 <div2 n="1type="scene">
  <head rend="italic">Actus primus, Scena prima.</head>
  <stage rend="italictype="setting">A tempestuous
     noise of Thunder and Lightning heard: Enter
     a Ship-master, and a Boteswaine.</stage>
  <sp>
   <speaker>Master.</speaker>
   <p>Bote-swaine.</p>
  </sp>
  <sp>
   <speaker>Botes.</speaker>
   <p>Heere Master: What cheere?</p>
  </sp>
  <sp>
   <speaker>Mast.</speaker>
   <p>Good: Speake to th' Mariners: fall
       too't, yarely, or we run our selues a ground,
       bestirre, bestirre.<stage type="move">Exit.</stage>
   </p>
  </sp>
  <stage type="move">Enter Mariners.</stage>
  <sp>
   <speaker>Botes.</speaker>
   <p>Heigh my hearts, cheerely, cheerely my harts: yare,
       yare: Take in the toppe-sale: Tend to th' Masters whistle:
       Blow till thou burst thy winde, if roome e-nough.</p>
  </sp>
 </div2>
</div1>
要素spと要素stageは,散文中にありながらも,劇中の対話のよ うに表現されている部分を記録するときに使われる. 以下の例は,19世紀の小説である. ここでは,解説の文章と,対話の文章が,同じ章に混在している.
<sp>
 <speaker>The reverend Doctor Opimiam</speaker>
 <p>I do not think I have named a single unpresentable fish.</p>
</sp>
<sp>
 <speaker>Mr Gryll</speaker>
 <p>Bream, Doctor: there is not much to be said for bream.</p>
</sp>
<sp>
 <speaker>The Reverend Doctor Opimiam</speaker>
 <p>On the contrary, sir, I think there is much to be said for him.
   In the first place ...</p>
 <p>Fish, Miss Gryll — I could discourse to you on fish by the
   hour: but for the present I will forbear ...</p>
</sp>
<sp>
 <speaker>Lord Curryfin</speaker>
 <stage>(after a pause).</stage>
 <p>
  <q>Mass</q> as the second grave-digger says
   in <title>Hamlet</title>, <q>I cannot tell.</q>
 </p>
</sp>
<p>A chorus of laughter dissolved the sitting.</p>

3.13 コアモジュール

Contents « 2 TEIヘダー » 4 テキスト構造モジュール

注釈
9.
この意味では,話されたテキストの様子(例えば声質,大きさな ど)も「強調」と似たものと見なすことができるが,本ガイドラ インでは,強調と話されたテキストとは,分けて捉えることにし ている.詳細は8.3.6 Shiftsを参照の こと.
10.
オックスフォード英語辞書では「to comedown」の意味を,「下げること.特にお金.」 「支払う」とある. これは,口語体またはユーモラスな文脈中で使われ,1700年から 19世紀後半まで使われていた.
11.
「正規化」という言葉には,ここで使われている意味よりも,よ り狭義の特別な意味を持つことがある. 要素reg は,各種の正規化,例えば,一般化,規格化,現代化,など全て で使うことができる.
12.
ここのデータ型は,XML Schema Part 2: Datatypes Second Editionにあるものを使っている. データ型には,以下のものがある. (ただし)1つだけ例外がある. 本ガイドラインでは,時間の表示方法として,時間のみ,または ISO 8601:2004の4.2.2.3節と4.3.3.節にある,時間と分の組み合 わせのみを認めている. W3Cでは,時間や日付のデータ型として,分と秒も処理の対象, 例えば並べ替えで使われる値とされている.
13.
符号化する人の多くが,元資料にある日付の項目で,改行を記録 しておくと,校正の時に便利であると感じている. しかし,この様な場合,タグを使わなくとも,元資料にある改行 を記録することは可能である.
14.
例えば,著者名を示す「London」と,出版地やタイトルの中 にある「London 」とを区別す るときなどである.
15.
要素biblStructにある構造情報を使う 書誌情報ソフトウェアとしては,BibTeXやScribeやProCiteがあ る. これらとTEIでは,各要素が1対1で対応することには成らない が,これらの違いを,要素biblStructの構造中で記録することはで きる. これに関するより詳細な情報は,3.11.4 他の書誌スキー ムとの関連を参照のこと.
16.
この分析は,難しい問題は全くない. 規格書が示すように,最初の下位タイトルは,フランス語で書か れた別タイトルの下位タイトルになっている. また,2つ目の下位タイトルは,英語の主タイトルと,フランス 語の別タイトルの下位タイトルになっている. これは,規格書で示された参照構造や,例中にあるタグにより, これらの関係が明示されていなくとも,問題になるようなもので はない.
17.
BibTeXのスキームは,Scribeと互換性があるように作られている. 但し,Scribeにあるいくつかの項目は,省略されている. ここにあるリストは,項目の一部でしかない.


Copyright TEIコンソーシアム 2007 Licensed under the GPL. Copying and redistribution is permitted and encouraged.
Version 1.0.