4 テキスト構造モジュール

Contents

この章では,TEI文書の素の上位構造を解説する. 完全なTEI文書には,要素teiHeaderに記録されるメタデータと, 要素textに記録される文書本体が含まれている. この2つの要素が,最上位要素であるTEIの中に記録されることになる. 要素teiHeaderは,ヘダーモジュールで定義さ れている. ヘダーモジュールの詳細は,2 TEIヘダーにある. 要素textの内容は,本章で詳しく解説される.

この要素TEIの派生形として,要素teiCorpusがある. この要素は,言語資料(コーパス)や複数の符号化テキストをまとめ る時に使われる. 要素teiCorpusは,複数のTEIをとりま とめることができる. 各要素TEIでは,それぞれのteiHeadertextを記録 することが可能で,さらに,これらをまとめた全 体向けのteiHeaderも記録することができる. これにより,符号化する人は,個別の要素TEIとは別に,コレクション全体向けの teiHeaderを記録することができ るようになる. これらの詳細や,コーパスの作り方については, 15 Language Corporaで解説されている.

テキスト構造モジュールでは,以下の要素を使うことができる. これらの要素は,TEI文書の構造上,最上位に現れるものとなる.
  • TEI TEIに準拠する文書.TEIヘダーとテキストを内容として含む. teiCorpusの要素になる.
  • teiCorpus TEI準拠のコーパス全体を示す.ヘダーが1つと,ひとつ以上の要素TEIから 成る.各要素TEIには,テキストヘダーと要素textが1つある.
  • teiHeader 全てのTEI準拠テキストが伴う,電子版のタイトルページを構成する,記述的・宣言的情報を示す.
  • text とつのテキストを示す.単体でも複合体でもよい.例えば,詩,舞台芸術, 随筆,小説,辞書,コーパスなど.
要素teiHeaderは,ヘダーモジュールで定義さ れている(詳細は,2 TEIヘダーを参照). TEI文書は,適切なモジュールをスキーマに導入していれば, クラスmodel.resourceLikeの メンバーを取ることもできる(例えば,ファクシミリ画像,素性シ ステム宣言)(詳細は, 11.1 Digital Facsimiles18.11 素性システム宣言 を参照). このクラスが使えない時には,要素 TEItextteiCorpusのみを使うことになる. これらの3要素は,本章で解説するテキスト構造モジュールで定義 されている.

TEI文書は「単一的」または「複合的」である. 「単一的」とは,1つの組織体を形作るものであり,「複合的」と は,異なる意味合いを持った個々の要素を束ねたものである. この区別は,必ずしも明確であるわけではない. 例えば,作品集は,ある状況下では,単一のものと見なされ,別の 状況下では,異なる複数の作品をまとめたものを見なされる. この様などちらとも取れるような場合,それぞれに利点・欠点があ る状況下で,符号化する人は,これらを選択しなくてはならない.

このどちらの場合でも,要素 textは使 うこと可能で,その中に,前付け,本文,後付を記録することがで きる. 単一的なテキストでは,その本文は要素bodyに記録 される. 複合(的な)テキストでは,その本文を構成する個々の部分は, groupでまとめられ,記録される. 単一的であれ複合的であれ,テキストの構造は,以下の要素で構成 される.
  • front 本文より前,文書の始めにある序文としてあるもの(標題,タイトル,序文, 献辞など).
  • body 前付,後付を除いた,単一の作品の本文全体を示す.
  • group ある単位として独立している個別テキストをまとめた複合テキストを示す. 例えば,ある著者の作品集やエッセイ集など.
  • back 後付.本文の後に続く付録などを示す.
単一的なテキストの構造は,以下のようになる.
<TEI>
 <teiHeader>
<!-- .... -->
 </teiHeader>
 <text>
  <front>
<!-- front matter of copy text, if any, goes here -->
  </front>
  <body>
<!-- body of copy text goes here -->
  </body>
  <back>
<!-- back matter of copy text, if any, goes here -->
  </back>
 </text>
</TEI>
統合テキストの構造は,2つの単一的なテキストから構成される 場合には,以下のようになる.
<TEI>
 <teiHeader>
<!-- .... -->
 </teiHeader>
 <text>
  <front>
<!-- front matter for composite text -->
  </front>
  <group>
   <text>
    <front>
<!-- front matter of first unitary text, if any -->
    </front>
    <body>
<!-- body of first unitary text -->
    </body>
    <back>
<!-- back matter of first unitary text, if any -->
    </back>
   </text>
   <text>
    <body>
<!-- body of second unitary text -->
    </body>
   </text>
  </group>
  <back>
<!-- back matter for composite text, if any -->
  </back>
 </text>
</TEI>
要素floatingTextは,あるひとつのテキストが, 他のテキスト中に埋め込まれている場合に使われる. 但し,これはその構造を変更するものではない. 例えば,テキストの流れを中断したり,引用を挿入したりするもので ある. この要素は,例えば「劇中劇」のようなテキストを符号化する場合 や,複数の話者が当該話者に割り込むような(一般には深い入れ子の) テキストを符号化する際に,便利である.

本章では,以下の要素が解説されている. 要素frontbackは, それぞれ,4.5 前付け4.7 後付で解説される. 複合テキストで使われる要素groupfloatingTextは, 4.3 複合テキスト と自在テキストで解説される. この他の要素,例えば,段落,リスト,句などを記録するものは,3 コアモジュールで解説されている. そこで解説される要素は,どのようなテキスト種でも,どのような場所でも 使うことができるものである.

4.1 本文の下位区分

あるテキストでは,本文が一連の部分から形成されていることがあ る. このような構成単位を,ここでは「構成要素(components」「構成 要素レベル要素(component-level elements)」と呼ぶことにする (詳細は,1.3 TEIのクラスを参照). 例えば,散文中にある段落やリストがそれに該当する. また,脚本では,発話やト書きがこれに相当する. また,辞書では,辞書項目がこれに相当する. また,この種の要素は,まとめられ,章や節などの,テキスト構造 上の下位区分となることもできる. この様なテキスト構造上の下位区分は,当該テキストの長さや,そ のジャンル,または作者や編者,出版者の意向により,その名称は様々である. 例えば,神話や聖書において,「編・書(book)」は大きな下位区分 を示すものであるが,報告書においては「パート(part)」や「節(section)」 が大きな下位区分となり,また小説においては「章(chapter)」が そのような下位区分となる. また,一続きの話となる散文ではないテキストでさえ,これ らと同じように,下位区分化されることがある. 例えば,脚本は「幕(act)」や「場(scene)」に下位区分される. また,リファレンス本は「節(section)」に下位区分される. また,新聞は「号(issue)」「欄(section)」などに下位区分される.

下位区分にはこの様に沢山の名称があることから,当該とラインで は,これらを同じような名前の要素で管理し,属性typeにより,それぞれの構造以外の特性を記 録することを提案する. この時の書き方として,2つのスタイル「付番区分」と「非付番 区分」を提案している. 付番区分とは,div1, div2のように,番号がついた要素を使 うものである. この時,それぞれの番号は,当該文書構造中の階層の深さを示すこ とになる. 一番大きな下位区分には「div1」,次に大きな下位区分には「div2」 が,その次に大きな下位区分には「div3」が付与され,以下,同様 に続けられる. 非付番区分とは,divのよう に,単一の要素名を入れ子のように使い,階層を作るものである. これら2つのスタイルは,単一のfrontbodybackと同時に使ってはいけない.

4.1.1 非付番区分

以下に示す要素は,非付番区分のスタイルで使用されるものである.
  • div 前付,本文,後付中のテキスト部分を示す.
この要素は,クラスatt.typedのメンバーであり, 以下の属性を取ることができる.
  • att.typed 要素を分類するための属性を示す.
    type 当該要素の分類を示す.
    subtype 必要であれば,当該要素の下位分類を示す.
このスタイルにより,例えば,テキストが2部構成で, それぞれが2つの章から構成されている場合,以下のように記録することができる.
<body>
 <div type="partn="1">
  <div type="chaptern="1">
<!-- text of part 1, chapter 1 -->
  </div>
  <div type="chaptern="2">
<!-- text of part 1, chapter 2 -->
  </div>
 </div>
 <div type="partn="2">
  <div n="1type="chapter">
<!-- text of part 2, chapter 1 -->
  </div>
  <div n="2type="chapter">
<!-- text of part 2, chapter 2 -->
  </div>
 </div>
</body>

4.1.2 付番区分

以下の要素は,付番区分として,テキストの下位区分を特定するた め使うことができる.
  • div1 前付,本文,後付中の第1位のテキスト部分を示す.
  • div2 前付,本文,後付中の第2位のテキスト部分を示す.
  • div3 前付,本文,後付中の第3位のテキスト部分を示す.
  • div4 前付,本文,後付中の第4位のテキスト部分を示す.
  • div5 前付,本文,後付中の第5位のテキスト部分を示す.
  • div6 前付,本文,後付中の第6位のテキスト部分を示す.
  • div7 前付,本文,後付中の一番小さいレベルのテキスト部分を示す.
これらの要素は,クラスatt.typedのメンバであることか ら,以下の属性を取ることができる.
  • att.typed 要素を分類するための属性を示す.
    type 当該要素の分類を示す.
    subtype 必要であれば,当該要素の下位分類を示す.

一番大きな付番区分はdiv1で,一番小さい付番区分は div7である. 付番区分が使われる際には,その下位要素には,自らの番号(例え ば,div3 の場合)よりも1つ小さい番号の付番区分(div4)のみを使うことができる.

このスタイルにより,例えば,テキストが2部構成で, それぞれが 2つの章から構成されている場合,以下のように記録することがで きる.
<body>
 <div1 type="partn="1">
  <div2 type="chaptern="1">
<!-- text of part 1, chapter 1 -->
  </div2>
  <div2 type="chaptern="2">
<!-- text of part 1, chapter 2 -->
  </div2>
 </div1>
 <div1 type="partn="2">
  <div2 n="1type="chapter">
<!-- text of part 2, chapter 1 -->
  </div2>
  <div2 n="2type="chapter">
<!-- text of part 2, chapter 2 -->
  </div2>
 </div1>
</body>

4.1.3 付番と非付番の選択

要素frontbodybackでは,要素divまたはdiv1のいずれかを,適切な入れ子の状 態で使うことができる. 非付番区分と付番区分とを混在して使うことはできない.

非付番区分と付番区分の選択は,記録する当該資料の複雑さの 底語に依存することになる. 非付番区分は,いくらでも深く入れ子化することができるが, 付番区分では,入れ子化の深さには制限がある. 入れ子化された階層の異なる区分に,異なる処理を施したい場 合(例えば,節ではなく章を単位に改ページする場合),付番区 分を使うと,必要とする区分に必要な処理を施すことが簡単に できる. 但し,非付番区分divを使っても,属性typeに情報を記録することで,同様のこ とは実現可能である. ソフトウェアによっては,付番区分の方が容易に処理できるか もしれない. その方が,付番区分を使うことで,文書全体の構造を事前に知っ ておく必要がないからである. 但し,このようなソフトウェアは,TEIスキームにある他の機 能を上手く扱えない可能性がある. 一方で,作品をまとめたコレクションの中で,同じ付番区分が 同じ種類のテキスト素性を記録していると保証することは難し いか,または不可能である. 例えば,ある作品の章はレベル1で記録され,別の作品の章で はレベル3で記録されることもあるだろう.

これら2つのスタイルとも,属性n と属性xml:idを使い,区分内容の 参照文字列やラベルを記録することができる (1.3.1.1 グローバル属性 を参照). 参照において重要な(参照システ ムについての詳細は3.10 参照システムを 参照のこと)各節では,このようなラベルは記録されるべきである.

クラスatt.typedのメンバー である属性typeと属性subtypeは,下位区分の名前や解説を記録 するために使うことができる. 例えば,「本」「章」「節」「部」「(韻文の)巻」「編」「連」 「(芝居の)幕」「場」などを属性値として取ることができる. 以下の例では,小説の構造を記録するために付番区分が使わ れ,そこではこれらの属性が使われている. また,この例では,4.2 どの区分中でも使える要素で解説されて いる要素と,3.1 段落とで解説さ れている要素pが使われている.
<div1 type="bookn="Ixml:id="JA0100">
 <head>Book I.</head>
 <div2 type="chaptern="1xml:id="JA0101">
  <head>Of writing lives in general, and particularly of Pamela, with a word
     by the bye of Colley Cibber and others.</head>
  <p>It is a trite but true observation, that examples work more forcibly on
     the mind than precepts: ... </p>
<!-- remainder of chapter 1 here -->
 </div2>
 <div2 type="chaptern="2xml:id="JA0102">
  <head>Of Mr. Joseph Andrews, his birth, parentage, education, and great
     endowments; with a word or two concerning ancestors.</head>
  <p>Mr. Joseph Andrews, the hero of our ensuing history, was esteemed to
     be the only son of Gaffar and Gammar Andrews, and brother to the
     illustrious Pamela, whose virtue is at present so famous ... </p>
<!-- remainder of chapter 2 here -->
 </div2>
<!-- remaining chapters of Book 1 here -->
 <trailer>The end of the first Book</trailer>
</div1>
<div1 type="bookn="IIxml:id="JA0200">
 <head>Book II</head>
 <div2 type="chaptern="1xml:id="JA0201">
  <head>Of divisions in authors</head>
  <p>There are certain mysteries or secrets in all trades, from the highest
     to the lowest, from that of <term>prime-ministering</term>, to this of
  <term>authoring</term>, which are seldom discovered unless to members of
     the same calling ... </p>
  <p>I will dismiss this chapter with the following observation: that it
     becomes an author generally to divide a book, as it does a butcher to
     joint his meat, for such assistance is of great help to both the reader
     and the carver. And now having indulged myself a little I will endeavour
     to indulge the curiosity of my reader, who is no doubt impatient to know
     what he will find in the subsequent chapters of this book.</p>
 </div2>
 <div2 type="chaptern="2xml:id="JA0202">
  <head>A surprising instance of Mr. Adams's short memory, with the
     unfortunate consequences which it brought on Joseph.
  </head>
  <p>Mr. Adams and Joseph were now ready to depart different ways ... </p>
 </div2>
</div1>
属性typeには,このような使い方に加え て(または補足として),特に意味を持たない下位区分の要素名に,特 徴を付加するために使うことができる. この様な修飾的な使用法については23.2 Personalization and Customizationで解説さ れている. これにより,例えば,要素chapterや要素partを新たに定義することができる. この様な,特に意味を持たない下位区分を定義するより簡単な方法と しては,いちメンバーから成るクラスを使うことができる. そのようなものとして,例えば,クラスmodel.divLike (メンバーはdiv),クラス model.div1Like(メンバー はdiv1), クラスmodel.div2Like(メ ンバーはdiv2)などがある. 記録対象が日記である場合,本文は一連の日記項目から構成され,そ れらは午前の項目であったり,午後に書く項目でったりする. この場合,以下にあるような記録方法を取ることができる. ひとつめは,非付番の方法である.
<body>
 <div type="entryn="1">
  <div type="morningn="1.1">
   <p>....</p>
  </div>
  <div type="afternoonn="1.2">
   <p>....</p>
  </div>
 </div>
 <div type="entryn="2">
  <div type="morningn="2.1">
   <p>....</p>
  </div>
  <div type="afternoonn="2.2">
   <p>....</p>
  </div>
 </div>
<!-- ...-->
</body>
これは,以下のような付番のスタイルでも同様に記録することができる.
<body>
 <div1 type="entryn="1">
  <div2 type="morningn="1.1">
   <p>....</p>
  </div2>
  <div2 type="afternoonn="1.2">
   <p>....</p>
  </div2>
 </div1>
 <div1 type="entryn="2">
  <div2 type="morningn="2.1">
   <p>....</p>
  </div2>
  <div2 type="afternoonn="2.2">
   <p>....</p>
  </div2>
 </div1>
<!-- ...-->
</body>
ここで,新しい要素diaryEntryを,クラス model.divLikeに追加したとしてみよ う. すると,以下のようになる(訳注:以下の例は破損している).
<body>
<!-- ...-->
</body>
また,新しい要素,例えば,要素diaryEntryを クラスmodel.div1に,さらに要素 amEntryと要素pmEntryをクラスmodel.div2に追加した場合には,以下のよ うにもできる(訳注:以下の例は破損している).
<body>
<!-- ... -->
</body>

このように,要素を追加・修正する方法については, 23.2 Personalization and Customizationを参照の こと.

4.1.4 部分区分と複合区分

多くの場合,要素divdiv1で記 録されるテキスト部分は,元の資料の内容と同じであり,一致す るものである. しかし,目的によっては,とりわけ当該テキストの規模が普通でな い長さや短さである時には,符号化する人は,便宜上,元資料の一 部のみをテキスト部分として記録したり,短いテキストを任意にま とめて記録したりすることもある. また,ある種のテキストでは,以下で例示するように,下位区分をまと めて上位区分を作る際に,その下位区分をまとめる順番を決めるこ とが困難であったり,不可能なこともある.

このような問題に対しては,クラスatt.divLikeにある要素を使い,対 処することになる.
  • att.divLike 区分(div, division)に相当する全要素に共通の属性を示す.
    org 当該区分の内容がどのように構成されているかを示す.
    sample 当該区分が,元資料のものを含むかどうか,そうであればその場所はど こかを示す.
    part 当該区分が,他の構造要素の部分であるかどうかを示す.例えば,複数 の連に分けられる発話など.
例えば,符号化する人は,詳説の各章から,始めの2000語のみを記 録するとした時,各章は部分的な区分と見なすことが可能で,これ を要素divを使い,以下のように記録することができる.
<div
  n="xx"
  sample="initial"
  part="Y"
  type="chapter">

 <p> ... </p>
</div>
この例にある‘xx’は,章番号を示している. 要素gap(3.4.3 追加,削除,省略を参照)は,元資料の一部が欠けていることを示している.
<div n="xxpart="Ytype="chapter">
 <p> ... </p>
 <gap extent="2reason="sampling"/>
 <p> ... </p>
</div>
TEIヘダーにある要素samplingDeclは,この様な元資料を完全は符号 化しないことに関する方針を記録するために使われるべきである. この詳細は,2.3.2 サンプリング宣言で解 説されている.
以下の例では,新聞にある,互いは関連のない小さな記事からなる段 を記録するために,ここで紹介した属性を使っている.
<div1 type="storylistorg="composite">
 <head>News in brief</head>
 <div2 type="story">
  <head>Police deny <soCalled>losing</soCalled> bomb</head>
  <p>Scotland Yard yesterday denied claims in the Sunday
     Express that anti-terrorist officers trailing an IRA van
     loaded with explosives in north London had lost track of
     it 10 days ago.</p>
 </div2>
 <div2 type="story">
  <head>Hotel blaze</head>
  <p>Nearly 200 guests were evacuated before dawn
     yesterday after fire broke out at the Scandic
     Crown hotel in the Royal Mile, Edinburgh.</p>
 </div2>
 <div2 type="story">
  <head>Test match split</head>
  <p>Test Match Special next summer will be split
     between Radio 5 and Radio 3, after protests this
     year that it disrupted Radio 3's music schedule.</p>
 </div2>
</div1>

要素div1に ある属性orgは,子要素div2の内容は,独 立してあるもので,それをひとつの区分としてまとめてあることを示して いる. 各話は,内容に影響なく自由な順序で読むことが可能である. 実際,ある場合には,読まれる順番を決めかねるような形で印刷され ているものもある. 各話は,他の話に影響を与えることなく,追加・削除されることがで きる.

ここで紹介した,複合テキストを記録する方法は,4.3.1 複合テキストで紹介する一般的で強力な手法と比べる と,ある程度の制約がある. しかし,ある場面では,ここで紹介した手法を使う方がよいだろう. 例えば,個々のテキストがとても短い場合などはそうである.

4.2 どの区分中でも使える要素

テキスト区分は,時に,短い見出しや,説明調のタイトル,署 名欄,題辞,短い引用,手紙冒頭にある挨拶文言などから,始まる ことがある. また,テキスト区分は,簡単な末尾文や,署名欄,追記などで終わ ることがある. この様なテキスト部分(例えば,署名欄)の多くは,テキスト区分の 始め,または終わりの位置に現れることがある.

この様な構造を記録するために,TEIでは5つのクラスを用意してい る. これらのクラスは,テキスト構造モジュールで定義されている.
  • model.divTop テキスト部分の始まりに現れる要素をまとめる.
  • model.divTopPart テキスト部分の始まりにのみ現れる要素をまとめる.
  • model.divBottom テキストの終わりに現れる要素をまとめる.
  • model.divBottomPart テキスト部分の終わりにのみ出現できる要素をまとめる.
  • model.divWrapper テキスト部分の上部また下部に現れる要素をまとめる.
初期値では,クラスmodel.divWrapperには, 以下のメンバーがある.
  • argument 下位部分にあるテキストのトピックを整形のリストまたは散文 で示す.
  • byline タイトルページや作品の冒頭や最後にある,作品の責任者を表 す第一位の記述.
  • dateline 手紙や新聞記事などの前後に付加されている,場所,日付,時 間などを簡易に示す.
  • docAuthor タイトルページにある(一般には署名欄にある)当該文書の著者名を示す.
  • docDate 文書の日付を示す.一般にはタイトルページに書かれている.
  • epigraph 章や節の始め,タイトルページなどにある引用(題辞)を示す.
クラスmodel.divTopは,以 下の要素もメンバーとしている. これらの要素は,クラスmodel.divTopPartで定義 されている.
  • head 各種の見出しを示す.例えば,節のタイトル,リストや用語 集,手書き資料の解説などにある見出し.
  • salute (著者以外の)序文や献呈書簡などのテキスト部分に附属する挨 拶文言または 挨拶,または書簡や(著者による)序文の大和 にある挨拶文言を示す.
  • opener テキスト部分の始まりに,日付欄,署名欄,挨拶文言など,前 置き的な部分としてあるものをまとめる.典型例は,手紙の 場合である.
要素head の詳細は,4.2.1 見出しと末尾を参 照のこと. また,要素epigraphや要素argumentについては,4.2.3 内容項目,題辞,後書き を参照のこと. また,要素opener については,4.2.2 開始部と終末部を 参照のこと.
クラスmodel.divBottomは,以下の要素もメンバーとしている. これらの要素は,クラスmodel.divBottomPartで定義されている.
  • closer 挨拶文言,日付欄など,ある区分の終わり,特に手紙の終わりにある一連の文言をまとめる.
  • signed (著者以外の)序文や献呈書簡などのテキスト部分にある,結びの挨拶などを 示す.
  • trailer テキスト部分の最後にある,結びのタイトルや脚注を示す.
  • postscript 追伸を示す.例えば,手紙の場合など.
要素trailerの詳細は,4.2.1 見出しと末尾を参 照のこと. また,要素closerと要素signed については,4.2.2 開始部と終末部を 参照のこと. また,要素postscriptについては,4.2.3 内容項目,題辞,後書き を参照のこと.

4.2.1 見出しと末尾

要素head は,どのレベルのテキスト区分においても,その始めにある見出 しを記録するために使うことができる. 例えば,以下の例のように,それは複数あっても良い.
<div1 n="Etym">
 <head>Etymology</head>
 <head>(Supplied by a late consumptive usher to a
   grammar school)</head>
 <p>The pale Usher — threadbare in coat, heart,
   body and brain; I see him now. He was ever
   dusting his old lexicons and grammars, ...</p>
</div1>

他のスキームと違い,TEIスキームでは,異なる階層レベルにある テキスト区分にある見出しに,異なる識別子を付加することを必須 とはしていない. あらゆる種類の見出しは,要素headで記録することができる. 見出しの種類やレベルは,要素headの親要素が示すことになる. 例えば,要素div1div2などや,非付番の要素divや,クラ スmodel.listLikeのメン バーがそのようなものとして使われる. しかし,要素divの場合は,符号化する人が,要素headが唯一 のメンバーであるクラスmodel.headLikeを拡張して,他 の要素を使えるようにすることも可能である.

ある種のテキスト(とりわけ新聞)では,見出しを分類しておく必要 がある. 例えば,一連のテキスト区分には,主見出しや小見出しなどがある. このような分類は,属性typesubtypeを使い記録することができる. また,特定種の見出しで使う要素も用意されている(例えば, 要素bylineや,要素datelineや,要素saluteなど.これらの詳細は,4.2.2 開始部と終末部). 但し,その場合でも,属性typeまたはsubtypeに,当該見出しを類別できるよう記録 する必要がある. これらの属性は,要素headが属するクラスatt.typedで定義されている.

以下の例は,英国の新聞から取られたもので,中心記事と種見出し が要素div で記録され,その中で適切な子要素が使われている.
<div type="story">
 <head rend="underlinedtype="sub">President pledges safeguards for 2,400 British
   troops in Bosnia</head>
 <head rend="screamtype="main">Major agrees to enforced no-fly zone</head>
 <byline>By George Jones, Political Editor, in Washington</byline>
 <p>Greater Western intervention in the conflict in
   former Yugoslavia was pledged by President Bush ...</p>
</div>

古い作品では,見出し,すなわち冒頭語句は,現在の作品よりも長く 書かれている. 見出しと見なされるテキストが,本文の中で使われている時,符号化 する人は,それを新しいテキスト区分の始めの部分として扱うかどう かを決める必要がある. もしそのテキスト部分が,それより前の記述よりも,後の記述と関連 が深い場合,それを見出しと見なして,要素headまたは新 たな要素div で記録することができる. もしそのテキスト部分が,単純に挿入されているだけのもの,例え ば,新聞や雑誌で見られる本文からの抜粋見出しである場合には,要 素quoteや,要素qまたはcitを使う方がよい.

要素trailerは,テキスト区分の終わりでのみ使 われ,見出しのような内容を記録することができる. 例えば,以下のようになる.
<div type="bookn="I">
 <head>In the name of Christ here begins the
   first book of the ecclesiastical history of Georgius Florentinus,
   known as Gregory, Bishop of Tours.</head>
 <div>
  <head>Chapter Headings</head>
  <list>
<!-- list of chapter heads omitted -->
  </list>
 </div>
 <div>
  <head>In the name of Christ here begins Book I of the history.</head>
  <p>Proposing as I do ...</p>
  <p>From the Passion of our Lord until the death of Saint Martin four
     hundred and twelve years passed.</p>
  <trailer>Here ends the first Book, which covers five thousand, five
     hundred and ninety-six years from the beginning of the world down
     to the death of Saint Martin.</trailer>
 </div>
</div>

4.2.2 開始部と終末部

見出しに加えて,テキスト区分には,各種の形式的な開始部分や終 了部分がある. 例えば,当該テキストが関連する人物の名前や住所,その生成に関 わる場所や時間,読者への挨拶文言や訓戒などがある. 特に,書簡体のテキスト区分では,この様な情報を記録する必要がある. 個人名や,日付,場所などの詳細を記録する際には, 13 名前,日付,人物,場所にある要素を使 うことができる. 簡単に記録する際には,以下の要素を使う方がよい.
  • byline タイトルページや作品の冒頭や最後にある,作品の責任者を表 す第一位の記述.
  • dateline 手紙や新聞記事などの前後に付加されている,場所,日付,時 間などを簡易に示す.
  • salute (著者以外の)序文や献呈書簡などのテキスト部分に附属する挨 拶文言または 挨拶,または書簡や(著者による)序文の大和 にある挨拶文言を示す.
  • signed (著者以外の)序文や献呈書簡などのテキスト部分にある,結びの挨拶などを示す.
要素bylinedatelineは,テキスト区分の出所や由 来を示す見出しを符号化するために使われる. 要素datelineと要素bylineと は,その要素名が新聞での用法から取られているが,だからといっ て新聞にあるテキストに対してのみ使えるということではない. 以下にある例では,要素datelineと要素signedが,小 説の序文の終わりを示している.
<div type="preface">
 <head>To Henry Hope.</head>
 <p>It is not because this volume was conceived and partly
   executed amid the glades and galleries of the Deepdene,
   that I have inscribed it with your name. ... I shall find a
   reflex to their efforts in your own generous spirit and
   enlightened mind.
 </p>
 <closer>
  <signed xml:lang="el">D.</signed>
  <dateline>Grosvenor Gate, May-Day, 1844</dateline>
 </closer>
</div>
この様な要素が,ある要素の始めや終わりで,一連となりまとまって いる場合には,以下にある要素で記録すると便利である.
  • opener テキスト部分の始まりに,日付欄,署名欄,挨拶文言など,前置 き的な部分としてあるものをまとめる.典型例は,手紙の 場合である.
  • closer 挨拶文言,日付欄など,ある区分の終わり,特に手紙の終わりに ある一連の文言をまとめる.
以下の例では,要素openerと要素closerは, 下位要素がまとまってあることを示している.
<div type="narrativen="6">
 <head>Sixth Narrative</head>
 <head>contributed by Sergeant Cuff</head>
 <div type="fragmentn="6.1">
  <opener>
   <dateline>
    <name type="place">Dorking, Surrey,</name>
    <date>July 30th, 1849</date>
   </dateline>
   <salute>To <name>Franklin Blake, Esq.</name> Sir, —</salute>
  </opener>
  <p>I beg to apologize for the delay that has occurred in the
     production of the Report, with which I engaged to furnish you.
     I have waited to make it a complete Report ...</p>
  <closer>
   <salute>I have the honour to remain, dear sir, your
       obedient servant </salute>
   <signed>
    <name>RICHARD CUFF</name> (late sergeant in the
       Detective Force, Scotland Yard, London). </signed>
  </closer>
 </div>
</div>
<div type="lettern="14">
 <head>Letter XIV: Miss Clarissa Harlowe to Miss Howe</head>
 <opener>
  <dateline>Thursday evening, March 2.</dateline>
 </opener>
 <p>On Hannah's depositing my long letter ...</p>
 <p>An interruption obliges me to conclude myself
   in some hurry, as well as fright, what I must ever be,</p>
 <closer>
  <salute>Yours more than my own,</salute>
  <signed>Clarissa Harlowe</signed>
 </closer>
</div>

日付や人物名,場所を符号化することについての詳細は, 3.5.4 日付や時間と,r 13 名前,日付,人物,場所を参照のこと.

4.2.3 内容項目,題辞,後書き

要素argumentは,章などのテキスト区分のはじ めにある,内容見出しをまとめた内容項目を記録するために使う ことができる. 内容項目の各項目は独立していることから,リスト形式で記録する のが一番簡単であるが,単純に,段落として簡単に示すことも可能である. 以下の2つの例では,同じ内容項目を符号化したものである.
<div type="chapn="6">
 <argument>
  <p>Kingston — Instructive remarks on early English history
     — Instructive observations on carved oak and life in general
     — Sad case of Stivvings, junior — Musings on antiquity
     — I forget that I am steering — Interesting result
     — Hampton Court Maze — Harris as a guide.</p>
 </argument>
 <p>It was a glorious morning, late spring or early summer, as you
   care to take it ...</p>
</div>
<div type="chapn="6">
 <argument>
  <list type="inline">
   <item>Kingston</item>
   <item>Instructive remarks on early English history</item>
   <item>Instructive observations on carved oak and life in
       general</item>
   <item>Sad case of Stivvings, junior</item>
   <item>Musings on antiquity</item>
   <item>I forget that I am steering</item>
   <item>Interesting result</item>
   <item>Hampton Court Maze</item>
   <item>Harris as a guide.</item>
  </list>
 </argument>
 <p>It was a glorious morning, late spring or early summer, as you
   care to take it ...</p>
</div>
題辞とは,タイトルページやテキスト区分の始めにある,他の作品か ら引用してある部分のことである. 題辞は,これ専用の要素epigraphで記録することができる. 題辞の内容は,一般には,要素qまたは要素quoteで記録 される. 例えば,以下のように,書誌参照とともに使われる.
<div n="19type="chap">
 <head>Chapter 19</head>
 <epigraph>
  <cit>
   <quote>I pity the man who can travel
       from Dan to Beersheba, and say <q>'Tis all
         barren;</q> and so is all the world to him
       who will not cultivate the fruits it offers.
   </quote>
   <bibl>Sterne: Sentimental Journey.</bibl>
  </cit>
 </epigraph>
 <p>To say that Deronda was romantic would be to
   misrepresent him: but under his calm and somewhat
   self-repressed exterior ...</p>
</div>

題辞以外で使われる引用についての詳細は,3.3.3 引用 を参照のこと.

後書きとは,手紙にある署名の後や,例は少ないが,書籍や,論文, 散文の本文中に出現する,一節のことである. 英語の場合,後書きはP.S.またはPSとした省略で示されることが多い. また,以下の例にあるよう,後書きは,上記省略形をラベルとして始められる ことが多い.
<div type="letter">
 <opener>
  <dateline>
   <placeName>Newport</placeName>
   <date when="1761-05-27">May ye 27th 1761</date>
  </dateline>
  <salute>Gentlemen</salute>
 </opener>
 <p>Capt Stoddard's Business
 <lb/>calling him to Providence, have
 <lb/>got him to look at Hopkins brigantine
 <lb/>&amp;amp; if can agree to Purchase her, shall
 <lb/>be much oblig'd for your further
 <lb/>assistance herein, &amp;amp; will acquiesce with
 <lb/>whatever you &amp;amp; he shall Contract
 <lb/>for — I Thank you for your
 <lb/>
  <unclear>Line</unclear> respecting the brigantine &amp;amp; Beg
 <lb/>leave to Recommend the Bearer
 <lb/>to you for your advice &amp;amp; Friendship
 <lb/>in this matter</p>
 <closer>
  <salute>I am your most humble servant</salute>
  <signed>Joseph Wanton Jr</signed>
 </closer>
 <postscript>
  <label>P.S.</label>
  <p>I have Mollases, Sugar,
  <lb/>Coffee &amp;amp; Rum, which
  <lb/>will Exchange with you
  <lb/>for Candles or Oyl</p>
 </postscript>
</div>

4.2.4 テキスト区分の内容

全てのテキスト(付番・非付番)区分では, クラスmodel.divWrappermodel.divTopmodel.divBottomの要素 の他,一連のマクロを取ることができる(1.3 TEIのクラスを参照). 実際に使うことができる要素は,導入するモジュールに寄っ て決まる. 但し,基盤モジュールで定義されている構成要素レベルの要素(例 えば,段落,リスト,発話,韻文行やそのグループ,など)は, 常に使うことができる. 例えば,舞台芸術モジュールを使う時には,( 7 Performance Textsで定義されている)舞台芸術向けのテキス トに特化した構成要素レベル,すなわち句レベルの項目を記録する ことができる. また,例えば,辞書モジュールを使うときには,( 9 Dictionariesで定義さ れている)辞書向けのテキストに特化した項目を記録することがで きる. また,発話モジュールを使うときには,発話,間,声,動作などを, 8.3 Elements Unique to Spoken Textsに定義されているよ うに,記録することができる.

当該テキストに,複数のモジュールを必要とする要素が,至る所に 含まれている場合,ひとつのモジュールに固執する必要はない.

4.3 複合テキストと自在テキスト

4.3.1 複合テキストで解説される要素groupは,処理などの際に独立した単位とされるべきテキストの集合を記録するために使われる. 4.3.2 自在テキストで解説される要素floatingTextは,独立した単位とされるべきテキストを,その周囲にあるテキストを中断させるように記録するために使われる.
  • group ある単位として独立している個別テキストをまとめた複合テキストを示す. 例えば,ある著者の作品集やエッセイ集など.
  • floatingText ひとつのテキストを示す.下位構造はあってもよい.当該部分はテキスト中 のどこにでも出現できる.自在テキスト.

4.3.1 複合テキスト

要素groupを使い記録される複合テキストの 例としては,作品集やコレクションがある. 個々の個別テキストに付帯する前付けの他,それらを合わせたコ レクション全体に付帯する前付けなどは,この種の符号化に相応 しい対象である. このような構造は,他の状況でも,有用な場合がある.

例えば,短編を集めたコレクション全体の構造は,以下のように 記録することができる.
<TEI>
 <teiHeader>
<!-- header information for the whole collection -->
 </teiHeader>
 <text>
  <front>
   <docTitle>
    <titlePart> The Adventures of Sherlock Holmes
    </titlePart>
   </docTitle>
   <docImprint>First published in <title>The Strand</title>
       between July 1891 and December 1892</docImprint>
<!-- any other front matter specific to this collection -->
  </front>
  <group>
   <text>
    <front>
     <head rend="italic">Adventures of Sherlock
           Holmes</head>
     <docTitle>
      <titlePart>Adventure I. —</titlePart>
      <titlePart>A Scandal in Bohemia</titlePart>
     </docTitle>
     <byline>By A. Conan Doyle.</byline>
    </front>
    <body>
     <p>To Sherlock Holmes she is always
     <emph>the</emph> woman. ... </p>
<!-- remainder of A Scandal in Bohemia here -->
    </body>
   </text>
   <text>
    <front>
     <head rend="italic">Adventures of Sherlock Holmes</head>
     <docTitle>
      <titlePart>Adventure II. —</titlePart>
      <titlePart>The Red-Headed League</titlePart>
     </docTitle>
     <byline>By A. Conan Doyle.</byline>
    </front>
    <body>
<!-- text of The Red Headed League here -->
    </body>
   </text>
   <text>
    <front>
     <head rend="italic">Adventures of Sherlock Holmes</head>
     <docTitle>
      <titlePart>Adventure XII. —</titlePart>
      <titlePart>The Adventure of the Copper Beeches</titlePart>
     </docTitle>
     <byline>By A. Conan Doyle.</byline>
    </front>
    <body>
     <p>
      <q>To the man who loves art for its
             own sake,</q> remarked Sherlock Holmes ...
     
<!-- remainder of The Copper Beeches here -->
          
           ... she is now the head of a private school
           at Walsall, where I believe that she has
           met with considerable success.</p>
    </body>
   </text>
<!-- end of The Copper Beeches -->
  </group>
 </text>
<!-- end of the Adventures of Sherlock Holmes -->
</TEI>
グループ化されたテキストが,さらにグループを含むことも可能で ある. この様なケースは,韻文のコレクションでは,よくあることで,他 のテキスト種でもありうる. 典型的なコレクション,例えば,Muses Library版のクラショーの詩の構造を考えてみよう. 以下にある批評版の導入と目次では,次のような章立てになってい る.
  • Steps to the Temple (1648年初版の詩のコレクション)
  • Carmen deo Nostro (1652年出版の,2つ目のコレクション)
  • The Delights of the Muses (1648年出版の,3つ目のコレクション)
  • Posthumous Poems, I (1つの草稿からの,複数の断片をまとめたもの)
  • Posthumous Poems, II (異なる草稿からの,複数の断片をまとめたもの)

ここにある3つのコレクションは全て,クラショーの生前に出版さ れたもので,それぞれが独立したものとして価値あるものであるこ とから,そのように記録されている. 作者が死後にまとめられた2つのコレクションを,Muses Library版に倣って,独立したグルー プとするかどうかは,任意である. 符号化する人は,2つのグループをひとつにまとめたり,グループ にもまとめず,単なるテキスト断片として扱うことも可能である.

Muses Library版のリプリントで は,上記3つのコレクションを,それぞれの前付け(タイトルペー ジ,献辞など)も含めて,まとめて記録している. 各前付けは,要素frontと,その構成要素で記録され (詳細は,4.5 前付け), 各コレクションの本文は,要素groupで記録される. コレクションにある個々の詩は,要素textで記録 される. コレクション全体の始めの部分は,以下のように符号化される (要素div,要素lgを使い韻文のテキスト下位区分を記録す る詳細は,3.12.1 韻文向けコア要素と, 6 韻文を参照のこと).
<text>
 <front>
  <titlePage>
   <docTitle>
    <titlePart>The poems of Richard Crashaw</titlePart>
   </docTitle>
   <byline>Edited by J.R. Tutin</byline>
  </titlePage>
  <div type="preface">
   <head>Editor's Note</head>
   <p>A few words are necessary ... </p>
  </div>
 </front>
 <group>
  <text>
   <front>
    <titlePage>
     <docTitle>
      <titlePart>Steps to the Temple, Sacred Poems</titlePart>
     </docTitle>
    </titlePage>
    <div type="address">
     <head>The Preface to the Reader</head>
     <p>Learned Reader, The Author's friend will not usurp much
           upon thy eye ... </p>
    </div>
   </front>
   <group>
    <text>
     <front>
      <docTitle>
       <titlePart>Sospetto D'Herode</titlePart>
      </docTitle>
     </front>
     <body>
      <div1 type="bookn="Herod I">
       <head>Libro Primo</head>
       <epigraph>
        <l>Casting the times with their strong signs</l>
       </epigraph>
       <lg n="I.1type="stanza">
        <l>Muse! now the servant of soft loves no more</l>
        <l>Hate is thy theme and Herod whose unblest</l>
        <l>Hand (O, what dares not jealous greatness?) tore</l>
        <l>A thousand sweet babes from their mothers' breast,</l>
        <l>The blooms of martyrdom ...</l>
       </lg>
      </div1>
     </body>
    </text>
    <text>
     <front>
      <docTitle>
       <titlePart>The Tear</titlePart>
      </docTitle>
     </front>
     <body>
      <lg n="I">
       <l>What bright soft thing is this</l>
       <l>Sweet Mary, thy fair eyes' expense?</l>
      </lg>
     </body>
    </text>
<!-- remaining poems of the Steps to the Temple appear here, each tagged as a distinct text element -->
   </group>
   <back>
<!-- back matter for the Steps to the Temple -->
   </back>
  </text>
  <text>
<!-- start of Carmen deo Nostro -->
   <front/>
   <group>
    <text/>
    <text/>
<!-- more texts here -->
   </group>
  </text>
  <text>
<!-- start of The Delights of the Muses -->
   <group>
    <text/>
    <text/>
<!-- more texts here -->
   </group>
  </text>
 </group>
 <back>
<!-- back matter for the whole collection -->
 </back>
</text>
要素groupは 符号化する人が,当該テキストをグループを構成するものと見なした ときに,いつでも使うことができる. 例えば,韻文や散文の作品集やコレクション,備忘録,雑誌,日誌な どがその対象となる. そのような典型例として,1987年にPaul Fussellが編纂し, W. W. Nortonから出版された作品集The Norton Book of Travelを例にとってみよう. この作品には,以下のような章が含まれている.
  1. 前付け(タイトルページ,謝辞,導入)
  2. 巡遊旅行のはじまり
  3. 18世紀と大陸巡遊旅行
  4. 最盛期
  5. 巡遊旅行のトレンド
  6. 巡遊旅行後 Post Tourism
  7. 後付け(許諾一覧,索引)
ここに掲載した章には,導入分に続いて,時代の説明文が,一部また は全文が含まれている. 例えば,上記にあげた2つめのグループには,とりわけ,以下のもの が含まれている.
  1. 序文
  2. マリー・ウォートリ・モンタギュー女史の5つの手紙
  3. スウィフトのガリバー旅行記からの抜粋
  4. アレクサンザー・ポープの2つの詩
  5. ボズウェルの雑誌記事からの2つの抜粋
  6. ウィリアム・ブレイクの詩
ひとりの作家が書いたものをまとめたものには,簡単な書誌記述が記 録されている. 抜粋の中には,複数の章や下位区分を含む,長文のものもあるが, 別の抜粋では,極めて短い文のものもある. 先のリストでも分かるように,含まれるテキスト種は,韻文,散 文,雑誌,手紙など,多様である.
この様な作品集を記録する一番簡単な方法は,個々の抜粋テキスト を,それぞれの方法で扱うことである. 章というより大きなグループを示す要素groupの中に, ひとりの作家が書いた一連のテキストを,その書誌情報に続いて,要 素groupを 使い記録することができる. 作品のひとつの章を構成するテキストも同様に,序文に続いて,要素 groupを使 い,当該作品の中で記録することができる. 例えば,以下のような構造になる.
<text>
<!-- the whole anthology -->
 <front>
<!-- title page, acknowledgments, introductory essay -->
 </front>
 <group>
<!-- body of anthology starts here -->
  <group>
   <head>The Beginnings</head>
<!-- sequence of texts or groups -->
  </group>
  <group>
<!-- The Eighteenth Century and the Grand Tour -->
   <text>
<!-- prefatory essay by editor -->
   </text>
   <group>
<!-- Section on Lady Mary Wortley Montagu starts -->
    <text>
<!-- biographical notice by editor -->
    </text>
    <text>
<!-- first letter -->
    </text>
    <text>
<!-- second letter -->
    </text>
<!-- ... -->
   </group>
<!-- end of Montagu section -->
   <text>
<!-- single text by Jonathan Swift starts -->
    <front>
<!-- biographical notice by editor -->
    </front>
    <body/>
   </text>
<!-- end of Swift section -->
   <group>
<!-- Section on Alexander Pope starts -->
    <text>
<!-- biographical notice by editor -->
    </text>
    <text>
<!-- first poem -->
    </text>
    <text>
<!-- second poem -->
    </text>
   </group>
<!-- end of Pope section -->
<!-- ... -->
  </group>
<!-- end of 18th century section -->
  <group>
   <head>The Heyday</head>
<!-- texts and subgroups -->
  </group>
<!-- ... -->
 </group>
<!-- end of the anthology proper -->
 <back>
<!-- back matter for anthology -->
 </back>
</text>
編集者による,各作者の紹介文も,そのように扱うことができる(例 えば,上記の例では,マリー・ウォートリ・モンタギュー女史とアレ クサンザー・ポープについての文章). また,中にあるテキストの前付けも,そのように扱うことができる( 例えば,スウィフトの文章に対する文章). 上記の例では,意図的に,一貫性なく,2つのアプローチを混在させている. 一貫性を持って記録することも可能である. 例えば,スウィフトの文章を1つのテキスト,編集者の文章を1つのテ キストとして,これらを含むスウィフトの章を,要素 groupで記録することができる. または,マリー・ウォートリ・モンタギュー女史の文章を, 編集者の序文を前書きに持つ1つのテキストとして,要素textで記録することができる. 後者の方法を使えば,アレクサンザー・ポープの章は,以下のように 記録することができる.
<text>
<!-- Section on Alexander Pope starts -->
 <front>
<!-- biographical notice by editor -->
 </front>
 <group>
  <text>
<!-- first poem -->
  </text>
  <text>
<!-- second poem -->
  </text>
 </group>
</text>
<!-- end of Pope section-->

「18世紀と大陸巡遊旅行」中の文章と,他の大きな章をまとめて,よ り大きな章として,要素groupではなく,要素textを使い,「前付け」として記録する ことも可能である.

このように,作品集が,異なる種類のテキスト(例えば,散文と韻文 の混成,転記された発話と辞書項目,手紙と韻文など)で構成されて いる場合,これらは,複数のモジュールを使い記録されることになる. 但し,3 コアモジュールにあるコアモジュールを使えば, 散文,舞台芸術,韻文が単純にまとめられているような場合には, これらに対応することができる.

備忘録のような短い抜粋から成る作品集の場合には,これらをそのよ うに記録するのではなく,単に引用として扱い,要素citで記録する 方が好ましい. 以下にある,構成要素レベルの要素は,この種の引用を記録するため に使うことができる.
  • cit 書誌参照を伴い,他の文書からの引用を示す.例えば,辞書の場 合には, 当該単語形が出現する例文を示したり,当該見出 し語の翻訳や用例を示したりする.
  • quote 語り手や著者が,当該テキスト外にあるものに向けた,一節を示す.
例えば,メルヴィルの「白鯨」の前付けにある,抜粋の章は,次のよ うに記録することができる.
<div n="2type="chap">
 <head>Extracts</head>
 <head>(Supplied by a sub-sub-Librarian)</head>
 <p>It will be seen that this mere painstaking burrower and
   grubworm of a poor devil of a Sub-Sub appears to have gone
   through the long Vaticans and street-stalls of the earth,
   picking up whatever random allusions to whales he could
   anyways find ...
   Here ye strike but splintered hearts together – there,
   ye shall strike unsplinterable glasses!</p>
 <p>
  <cit>
   <quote>And God created great whales.</quote>
   <bibl>Genesis</bibl>
  </cit>
  <cit>
   <quote>
    <l>Leviathan maketh a path to shine after him;</l>
    <l>One would think the deep to be hoary.</l>
   </quote>
   <bibl>Job</bibl>
  </cit>
  <cit>
   <quote>By art is created that great Leviathan,
       called a Commonwealth or State — (in Latin,
   <mentioned xml:lang="la">civitas</mentioned>), which
       is but an artificial man.</quote>
   <bibl>Opening sentence of Hobbes's Leviathan</bibl>
  </cit>
 </p>
</div>
要素quoteと要 素biblについて の詳細は,それぞれ3.3.3 引用3.11 書誌項目の記述または参照を参照のこと.

4.3.2 自在テキスト

単一的な構造のテキストであれ,複合的な構造のテキストであれ, テキストの持つ重要な特徴として「分割性」というものがある .一般に,利用可能なテキスト(または部分テキスト)全体は,各階層レベルに おいて,余すことなく分割することができる. XML文書には,ひとつのルート要素があり,ひとつの木構造を構成 している. 木構造の各ノードは,部分木を構成している. つまり,テキストの内部構造は,入れ子構造として,各階層で下位 構造を構成していると考えるのがよい. このように考えるのは,多くの文書で正しいものではあるが,全て の文書で正しいというものではない. 例えば,特定の階層レベルにおいて部分的に分割されているテキスト では,正しくない. テキストAはテキストBに含まれているとして,テキストB の一部が,テキストAよりも先に存在し,また,テキストAの後にも 存在している時,テキストB全体を分割することはできない. このような場合の,テキストAを,「自在テキスト(floating text)」 と呼ぶことにする.

要素floatingTextは,クラスmodel.divPartのメンバーで, 段落と同じように,区分レベルの要素の中で使うことができる. 例えば,「デカメロン」や「アラビアンナイト」のような作品は, 枠テキストの部分を前付けや後付けとして,個々のテキストをまと めたものというよりは,枠物語という独立したテキスト中に埋め込 まれる,多くの自在テキストを含んでいると見なすことができる.

例えば,18世紀のJane Barkerによる作品" The Lining tothe Patch-Work Screen(1726)を考えてみる. この作品には,100近い話が,(作品タイトルが示すように)独立し たパッチワークの中にある. 作品では,まず,登場人物Galeciaの紹介から始まり,数ページ後に は,異なる話であるCaptain Manlyが始められる.
<p>Galecia one Evening setting alone in her Chamber by a clear Fire,
and a clean Hearth ... reflected on the Providence of our
All-wise and Gracious Creator.... </p>
<p>She was thus ruminating, when a Gentleman enter'd the Room, the
Door being a jar... calling for a Candle, she beg'd a thousand
Pardons, engaged him to sit down, and let her know, what had so long
conceal'd him from her Correspondence.
</p>
<pb n="5"/>
<floatingText>
 <body>
  <head>The Story of <hi>Captain Manly</hi>
  </head>
  <p>Dear Galecia, said he, though you partly know the loose, or rather
     lewd Life that I led in my Youth; yet I can't forbear relating part of
     it to you by way of Abhorrence...
  
<!-- Captain Manly's story here -->
     I had lost and spent all I had in the World; in which I verified the
     Old Proverb, That a Rolling Stone never gathers Moss,
  </p>
 </body>
</floatingText>
<pb n="37"/>
Captain Manlyの話が終わると,Galeciaの話に戻り,さらに突然,2 つの異なる話へと進んでいく. しかし,Galeciaの話は,各テキストの合間にまた現れる. そこで,要素floatingtextを使い,以下の ように,各話を記録することができる.
<p>The Gentleman having finish'd his Story, Galecia waited on him to
the Stairs-head; and at her return, casting her Eyes on the Table, she
saw lying there an old dirty rumpled Book, and found in it the
following story: </p>
<floatingText>
 <body>
  <p> IN the time of the Holy War when
     Christians from all parts went into the Holy Land to oppose the Turks;
     Amongst these there was a certain English Knight...</p>
<!-- rest of story here -->
  <p>The King graciously pardoned the Knight; Richard was kindly receiv'd
     into his Convent, and all things went on in good order: But from hence
     came the Proverb, We must not strike <hi>Robert</hi> for
  <hi>Richard.</hi>
  </p>
 </body>
</floatingText>
<pb n="43"/>
<p>By this time Galecia's Maid brought up her Supper; after which she
cast her Eyes again on the foresaid little Book, where she found the
following Story, which she read through before she went to bed.
</p>
<floatingText>
 <body>
  <head>The Cause of the Moors Overrunning
  <hi>Spain</hi>
  </head>
  <p>King ———— of Spain at his Death, committed the Government of his
     Kingdom to his Brother Don ——— till his little Son should come of
     Age ...</p>
  <p>Thus the little Story ended, without telling what Misery
     befel the King and Kingdom, by the Moors, who over ran the Country for
     many Years after. To which, we may well apply the Proverb,
  <quote>
    <l>Who drives the Devil's Stages,</l>
    <l>Deserves the Devil's Wages</l>
   </quote>
  </p>
 </body>
</floatingText>
<p>The reading this Trifle of a Story detained Galecia from her Rest
beyond her usual Hour; for she slept so sound the next Morning, that
she did not rise, till a Lady's Footman came to tell her, that his
Lady and another or two were coming to breakfast with her...
</p>

複数の話から成るテキストでは,各入れ子化された話は,全体をまと める話よりも重要である. また,全体をまとめる枠物語の部分は,各話の前付けや後付けとして 扱いたいこともある. この様な事態はよくあることで,例えば,チョーサーの「カンタベリー 物語」でも,各話には前付けが添えられ,それには,続く話を紹介す る話し手が登場する. また,その後付けには,巡礼者(pilgrim)がその話にコメントを加え ている.

要素floatingTextは,複合テキストでのみ使われるべき である. ある話の中で,他の話からの登場人物に関する話が部分的,または全 面に現れる際には, 3.3.3 引用で解説する 要素quote を使うべきである.

4.4 仮想区分

テキスト区分全体が,自動的に生成される場合,例えば,当該文書 または別の文書から自動的に派生するような場合には,符号化する 人は,当該テキストを明示することなく,代わりに,PIまたは要素 divGenにより,当該の場所を示すだけで済ませた いことがある.
  • divGen ソフトウェアで自動生成されたテキスト部分の場所を示す.

この要素は,クラスmodel.divGenLikeの唯一 のメンバーである. 要素divGenは,クラスatt.typedのメンバーでもあることから,属 性typeや属性sybtypeを使うことができる. また,この要素は,要素divや要素div1が使えるところで使うことができる.

例えば,ある作品の目次が,始めに出てくる要素headと,テキスト中にある各要素 divから構 成される場合,以下のように簡単に記録することができる.
<divGen type="toc"/>
また,例えば,ある転記版を,その翻訳版と共に電子版とした際に,転 記テキストと翻訳テキストと,これら2つを合わせたテキストの,3つの 版を分けておきたいとする. このようなケースは,以下のように記録することができる.
<div>
<!-- transcript here-->
</div>
<div>
<!-- translation here -->
</div>
<divGen type="alignment"/>
要素divGen の出現と共に実行される処理は,ソフトウェアやスタイルシート中で定 義されることになる. TEIで定義するタグの機能は,単に仮想区分の場所を特定することと, 自動生成される仮想区分の種類を特定することである. 特別な処理命令として,人がそれを指示することになる.

4.5 前付け

「前付け」とは,(全てがそうではないが,一般的には印刷された) テキストにある独立した部分のことで,序章いった,当該作品の一 部として特定できる部分のことである. 例えば,タイトルページや序文は,典型的なそれである. また,芝居の序幕(prologue)などもこの例に相当するといえるだろ う. 符号化されたテキストにおける前付けを, 2 TEIヘダーにあるTEIヘダーと混同してはいけない. TEIヘダーは,データファイルの前付けに相当するものであって, 符号化されるテキストの前付けに相当するものではない.

符号化する人によっては,当該テキストの前付けを,その元資料に おける扱われ方や,その他の理由により,無視することもあるだろ う. また,前付けの部分または全てを,テキスト中に要素frontで記 録することも可能である. 18 前付けは,タイトルページを除いて(これについては 4.6 タイトルページを 参照),同じ要素で記録されることになる. テキスト本文にある下位区分と,前付けにある各種の下位区分向 けの専用のタグがあるわけではない. 前付けでは,付番区分または非付番区分の要素divを使う ことができる. 以下にある属性値は,属性typeで使われ19,前付けにある内容の種類を 区別するために使われる.
preface
著者または出版者が,当該テキストの内容,目的,出自に ついて解説する,読者に向けた序文.
ack
著者が,個人または団体に対して,当該テキストの作成に 関して,公式に宣言する謝辞.
dedication
著者が,個人または団体に対して,公式に表明する献辞.
abstract
一連の散文により解説された,当該テキストの内容の概要.
contents
当該作品の構造,または構成内容のリストを示す目次. 要素listは,その構造を記 録するためだけに使われるべきである.
frontispiece
時にテキストを含む口絵.
以下にある長い例では,各種の前付けを符号化したものである. 例えば,以下の例では,前付けが,4.6 タイトルページ にある,タイトルページから始められ,続いて 献辞と序文がそれぞれが要素 divで記録 されている.
<div type="dedication">
 <p>To my parents, Ida and Max Fish</p>
</div>
<div type="preface">
 <head>Preface</head>
 <p>The answer this book gives to its title question is <q>there is
     and there isn't</q>.</p>
 <p>Chapters 1–12 have been previously published in the
   following journals and collections:
 <list>
   <item>chapters 1 and 3 in <title>New literary History</title>
   </item>
   <item>chapter 10 in <title>Boundary II</title> (1980)</item>
  </list>.
   I am grateful for permission to reprint.</p>
 <signed>S.F.</signed>
</div>
この前付けは,さらに要素divを伴い,そこに目次が記録されている. 目次の内容は,要素list(詳細は,3.7 リストで示されている. 要素ptrが,ページ参照を示すために使われて いることに注意して欲しい. この例では,以降にある要素divで示された,当該テキストの各章にある識別子 (fish1やfish2など)を指示参照している(要素ptrについての詳細は,3.6 簡単なリンクと相互参照を参照のこと).
<div type="contents">
 <head>Contents</head>
 <list>
  <item>Introduction, or How I stopped Worrying and Learned to Love
     Interpretation <ptr target="#fish1"/>
  </item>
  <item>
   <list>
    <head>Part One: Literature in the Reader</head>
    <item n="1">Literature in the Reader: Affective Stylistics
    <ptr target="#fish2"/>
    </item>
    <item n="2">What is Stylistics and Why Are They Saying Such
         Terrible Things About It? <ptr target="#fish3"/>
    </item>
   </list>
  </item>
 </list>
</div>
<div xml:id="fish1">
 <head>Introduction</head>
<!-- .... -->
</div>
<div xml:id="fish2">
 <head>Literature in the Reader</head>
<!-- .... -->
</div>
<div xml:id="fish3">
 <head>What is stylistics?</head>
<!-- .... -->
</div>
以下では,索引にあるポインターが,章が始まるページの区切を指示して おり,そこにターゲットとなるマークアップがあることを前提としている.

<!-- .... --><item n="1">Literature in the Reader: Affective Stylistics
<ref target="#fish-p24">24</ref>
</item>
<!-- .... -->
<div type="chapter">
 <head>Literature in the Reader</head>
 <pb xml:id="fish-p24"/>
<!-- .... -->
</div>
<!-- .... -->
以下の例では,付番区分により,中世テキストの前付けが記されてい る. ここでは,現在でいうタイトルページがないことに注意して欲しい. タイトルは,前付けの見出しとして示されている. また,要素divにあ る属性typeが,現在では一般には見かけ ない,例えば,祈祷文などを示すために使われていることに注意して 欲しい.
<front>
 <div1 type="incipit">
  <p>Here bygynniþ a book of contemplacyon, þe whiche
     is clepyd <title>þE CLOWDE OF VNKNOWYNG</title>,
     in þe whiche a soule is onyd wiþ GOD.</p>
 </div1>
 <div1 type="prayer">
  <head>Here biginneþ þe preyer on þe prologe.</head>
  <p>God, unto whom alle hertes ben open, &amp;amp; unto whome alle wille
     spekiþ, &amp;amp; unto whom no priue þing is hid: I beseche
     þee so for to clense þe entent of myn hert wiþ þe
     unspekable 3ift of þi grace, þat I may parfiteliche
     loue þee &amp;amp; worþilich preise þee. Amen.</p>
 </div1>
 <div1 type="preface">
  <head>Here biginneþ þe prolog.</head>
  <p>In þe name of þe Fader &amp;amp; of þe Sone &amp;amp;
     of þe Holy Goost.</p>
  <p>I charge þee &amp;amp; I beseeche þee, wiþ as moche
     power &amp;amp; vertewe as þe bonde of charite is sufficient
     to suffre, what-so-euer þou be þat þis book schalt
     haue in possession ...</p>
 </div1>
 <div1 type="contents">
  <head>Here biginneþ a table of þe chapitres.</head>
  <list>
   <label>þe first chapitre </label>
   <item>Of foure degrees of Cristen mens leuing; &amp;amp; of þe
       cours of his cleping þat þis book was maad vnto.</item>
   <label>þe secound chapitre</label>
   <item>A schort stering to meeknes &amp;amp; to þe werk of þis
       book</item>
   <label>þe fiue and seuenti chapitre</label>
   <item>Of somme certein tokenes bi þe whiche a man may proue
       wheþer he be clepid of God to worche in þis werk.</item>
  </list>
  <trailer>&amp; here eendeþ þe table of þe chapitres.</trailer>
 </div1>
</front>

もし,目次を自動生成する場合には,要素divGenまた はPIを使い,そのことを示すことも可能である.

4.6 タイトルページ

古い版本や写本にある,タイトルページや他の前付け要素につい ての,詳細な分析は,記述的参照やカタログ作成において,重要で ある. このような分析では,ここで紹介するものより,精緻なモジュールが必要となるだろう. 以下の要素は,多くのタイトルページにある主な特徴を記録するた めのものである.
  • titlePage 前付や後付中にある,テキストのタイトルページを示す.
  • docTitle 当該文書のタイトルを示す.タイトルページにあるタイトルの 全情報を含む.
  • titlePart タイトルページに示されている,作品タイトルの下位部分を示す.
    type 当該タイトルにおける,当該下位部分の役割を示す.
  • argument 下位部分にあるテキストのトピックを整形のリストまたは散文 で示す.
  • byline タイトルページや作品の冒頭や最後にある,作品の責任者を表 す第一位の記述.
  • docAuthor タイトルページにある(一般には署名欄にある)当該文書の著者 名を示す.
  • epigraph 章や節の始め,タイトルページなどにある引用(題辞)を示す.
  • imprimatur 作品の出版に関する公式の情報を示す.場合によっては,タイ トルページや その左ページに出現する必要がある.
  • docEdition タイトルページにある当該文書の版を示す.
  • docImprint 刊記にある出版関連情報を示す.例えば,出版日,出版者名な ど.一般には タイトルページの下にある.
  • docDate 文書の日付を示す.一般にはタイトルページに書かれている.
  • graphic/ テキスト列中にある図,絵,図表の場所を示す.

これらの要素は,14 図・表・式で解説される要素figureと共に, クラスmodel.titlepagePartを構成する. このクラスのメンバーは, 要素titlePageの中で,必要なだけ使うことができる. 要素figureは,タイトルページ中に,非テ キストのものがあることを示すものである. 例えば,印刷所の紋様やイラストなどは,3.9 図等の非テキスト内容 で解説する要素graphicで記録すべきである.

上記の要素(訳注:の一部)は,要素headと共に,クラスmodel.pLike.frontを構 成する. このクラスの要素は,要素frontの中で,自由に選択して使 われ,タイトルページを完全に符号化する必要もない.

これらのクラスに,新しい要素を追加したい時には, 23.2 Personalization and Customizationで解説する方法を使うことができる. 以下の2つの例で,これらの要素の使用例を示す. ひとつ目の例では,本節で先に示した作品のタイトルページを記録 している.
<front>
 <titlePage>
  <docTitle>
   <titlePart type="main">Is There a Text in This Class?</titlePart>
   <titlePart type="sub">The Authority of Interpretive Communities</titlePart>
  </docTitle>
  <docAuthor>Stanley Fish</docAuthor>
  <docImprint>
   <publisher>Harvard University Press</publisher>
   <pubPlace>Cambridge, Massachusetts</pubPlace>
   <pubPlace>London, England</pubPlace>
  </docImprint>
 </titlePage>
</front>
次の例では,典型的な17世紀の,冗長な例である. 要素lbが,元資料の行を 記録していることに注意して欲しい.
<titlePage>
 <docTitle>
  <titlePart type="main">THE
  <lb/>Pilgrim's Progress
  <lb/>FROM
  <lb/>THIS WORLD,
  <lb/>TO
  <lb/>That which is to come:</titlePart>
  <titlePart type="sub">Delivered under the Similitude of a
  <lb/>DREAM</titlePart>
  <titlePart type="desc">Wherein is Discovered,
  <lb/>The manner of his setting out,
  <lb/>His Dangerous Journey; And safe
  <lb/>Arrival at the Desired Countrey.</titlePart>
 </docTitle>
 <epigraph>
  <cit>
   <quote>I have used Similitudes,</quote>
   <bibl>Hos. 12.10</bibl>
  </cit>
 </epigraph>
 <byline>By <docAuthor>John Bunyan</docAuthor>.</byline>
 <imprimatur>Licensed and Entred according to Order.</imprimatur>
 <docImprint>
  <pubPlace>LONDON,</pubPlace>
   Printed for <name>Nath. Ponder</name>
  <lb/>at the <name>Peacock</name> in the <name>Poultrey</name>
  <lb/>near <name>Cornhil</name>, <docDate>1678</docDate>.
 </docImprint>
</titlePage>
この例のように,元資料にあるタイトルページの特徴的な素性を符号 化することが重要な場合には,2.3.4 タグ付け宣言で 示す手法を使うこともできる.

タイトルページが記録されるとき,その物理的な配置は,重要な場合 も多くある. これを記録する際には,16 リンク,分割,統合で解説する要 素segを使 い,タイトルページにある印刷上の各単位を特定し,それらにグロー バル属性rendを付与して,表現方法を 記録することができる. また,ページや,行,罫線といった,印刷の単位を記録するためのモ ジュールを使い,線の太さや,行間の長さ,カーニングの程度,フォ ントの種類などを記録することができる. これらの詳細については,11 Representation of Primary Sourcesを参照のこ と.

4.7 後付

符号化の仕方は,どの要素を前付けで使い,どの要素を後付けで使 うかにより,様々である. 例えば,目次が前付けにある書籍もあれば,目次が後付けにある書 籍もある. タイトルページも,前付けにあったり,後付けにあったりする場合 がある. 従って,要素backと要素frontの内容モデルは,同じものになる.

以下にある属性値は,属性typeで使わ れ,後付けある内容の種類を 区別するために使われる.
appendix
当該作品中で,補助的にある,独立して閉じた章で,付加的ま たは増補的なテキストを示す.
glossary
定義テキストと共にある要素のリスト. これは,list type="gloss"のよう に符号化されるべきである(3.7 リストを参照のこと).
notes
共に記される解説に準じたテキストを示す.
bibliogr
書誌引用のリスト. これは,要素listBiblで符号化されるべき(3.11 書誌項目の記述または参照を参照).
index
当該作品の索引.
colophon
当該書籍の物理的な状態を解説する,書籍の最後に示されるも の.
奥付を記録するための要素として,上記以外の要素は用意されてい ない. 典型例としては,例えば,以下のようなものがある. ひとつ目は,索引である(転記すべき項目が印刷されているケース).
<back>
 <div type="index">
  <head>Index</head>
  <list type="index">
   <item>Actors, public, paid for the contempt attending
       their profession, <ref>263</ref>
   </item>
   <item>Africa, cause assigned for the barbarous state of
       the interior parts of that continent, <ref>125</ref>
   </item>
   <item>Agriculture
   <list type="indexentry">
     <item>ancient policy of Europe unfavourable to, <ref>371</ref>
     </item>
     <item>artificers necessary to carry it on, <ref>481</ref>
     </item>
     <item>cattle and tillage mutually improve each other, <ref>325</ref>
     </item>
     <item>wealth arising from more solid than that which proceeds
           from commerce <ref>520</ref>
     </item>
    </list>
   </item>
   <item>Alehouses, not the efficient cause of drunkenness, <ref>461</ref>
   </item>
  </list>
 </div>
</back>
元資料にある行が,明示的に符号化されて,識別子が付与されている時 ,それらを索引中で参照する際には,それらを行として符号化する方が 便利である. 例えば,元資料の461ページを記録する場合,以下のようにすることが できる.
<pb xml:id="P461"/>
そして,この場所を以下のように記述すると,便利である.
<item>Alehouses, not
the efficient cause of drunkenness, <ref target="#P461">461</ref>
</item>
<item>Alehouses, not the efficient cause of drunkenness,<ptr target="#P461"/>
</item>
また,書簡にある後付け部分は,以下のように記録することができる.
<back>
 <div type="letter">
  <head>A letter written to his wife, founde with this booke
     after his death.</head>
  <p>The remembrance of the many wrongs offred thee, and thy
     unreproued vertues, adde greater sorrow to my miserable state,
     than I can utter or thou conceiue. ...
     ... yet trust I in the world to come to find mercie, by the
     merites of my Saiuour to whom I commend thee, and commit
     my soule.</p>
  <signed>Thy repentant husband for his disloyaltie,
  <name>Robert Greene.</name>
  </signed>
  <epigraph xml:lang="la">
   <p>Faelicem fuisse infaustum</p>
  </epigraph>
  <trailer>FINIS</trailer>
 </div>
</back>
また,書簡の特徴を伴った,正誤表や補遺のリストは,次のよ うに記録することができる.
<back>
 <div type="corrigenda">
  <head>Addenda</head>
  <salute xml:lang="la">M. Scriblerus Lectori</salute>
  <p>Once more, gentle reader I appeal unto thee, from the shameful
     ignorance of the Editor, by whom Our own Specimen of
  <name>Virgil</name> hath been mangled in such miserable manner, that
     scarce without tears can we behold it. At the very entrance, Instead
     of <q xml:lang="gr">προλεγομενα</q>, lo!
  <q xml:lang="gr">προλεγωμενα</q> with an Omega!
     and in the same line <q xml:lang="la">consulâs</q> with a circumflex!
     In the next page thou findest <q xml:lang="la">leviter perlabere</q>,
     which his ignorance took to be the infinitive mood of
  <q xml:lang="la">perlabor</q> but ought to be
  <q xml:lang="la">perlabi</q> ... Wipe away all these
     monsters, Reader, with thy quill.</p>
 </div>
</back>

4.8 テキスト構造モジュール

本章で紹介したテキスト構造モジュールでは,以下の要素を使うことができ る. これら構成要素の選択や組み合わせについては, 1.2 TEIスキーマの定義 にある.

Contents « 3 コアモジュール » 5 標準化されていない文字と字形の表現

注釈
18.
この選択の決断については,ヘダー中の要 素samplingDeclに記録されるべきである.
19.
リスト中にある推奨値について,TEI準拠テキストを扱うソフトウェア はこれらを認識し,処理されることが推奨される.但し,ユーザー は,これらの属性値に縛られることはない.


Copyright TEIコンソーシアム 2007 Licensed under the GPL. Copying and redistribution is permitted and encouraged.
Version 1.0.