3 コアモジュール
この章では,各種テキストで使われ,どのTEI文書でも使うことが できる要素を解説する. 多くの要素は,どこでも使える,いわゆる自在句としてある. テキスト構造のどこでも使うことが可能である. 但し,何かしらの上位レベルの要素に含まれることにはなる. これらの要素の中には,(例えば,書誌情報の引用やリストに関す る要素では)他よりはよく規定された内部構造を持つものもある. 但し,多くの要素は,内部構造に制限はない. これらの要素の内容は,一般には,数語程度のもので,従来の印刷 されたテキスト中に対応したものになっている. 例えば,フォントの変更,引用符,句点,などのレイアウトに変更 が生じるものである.
本章は,まずはじめに,段落を示す要素pの解説から始める. これは,TEIの各モジュールにある自在テキスト向けの,もっとも 原初的な単位となる. 続く3.2 句点法では, 伝統的な句点法の解釈に関する問題点を解説する. 句点法に関する曖昧な点に対して,本ガイドラインがで提唱する 解決法を示す.
続く3.3 強調部分と引用では,句レベル要素を解説す る. この要素は,一般には,印刷に関する(従って,伝統的なマークアップ言語 で扱われてきた)素性を記録するものである. 例えば,フォントの変更を示したり(3.3.2 強調・他言語など), 引用符を示したり(3.3.3 引用),用語や引用語,解説などの素性を 示したりする(3.3.4 用語,注釈,同等語,解説).
3.4 簡単な編集上の変更では,編集時の手入れ,すなわ ち,校正・修正などを記録する,句レベルの要素を紹介する. この要素は,そのような情報を符号化する仕組みの一部をまとめた もので(11 Representation of Primary Sources),多くの場合で十分に 機能するものである.
続く節(3.5 名前,数値,日付,略語,住所)では,処理 や分析の際に必要となるが,従来の印刷では明示的に指摘されてい ない,句レベル,挿入レベルの要素を解説する. ここでは,名前(3.5.1 参照文字),数値や計測値(3.5.3 数値や計測値),日付や時間( 3.5.4 日付や時間),省略(3.5.5 略語),住所(3.5.2 住所)について扱う.
また,続く節(3.6 簡単なリンクと相互参照)では,相互参照や テキストリンクを符号化するための仕組みの一部を示す. この機能のは,16 リンク,分割,統合にあ る. ここでの要素は,この機能のうち,広く一般に使用される一部である.
次の3.7 リストと 3.8 注釈と索引では, 2種類の疑似構造要素,リストと注釈を示す. この2つは,段落や,段落間に出現する塊レベルの要素内で使われ る. リストは,任意の構造を持つことが可能である. 注釈には,元の資料にあるものと,符号化する際に解釈を記録する アノテーションとしてあるものがある. ここでの要素は,この種の機能のうち(17 簡易分析機能),どこでも 使用可能な一部のものである.
続く3.9 図等の非テキスト内容で は,テキスト中に現れる,図や他の非テキスト内容を示す方法を紹 介する. マルチメディアに関する機能の詳細は,14 図・表・式と16 リンク,分割,統合で扱う.
続く3.10 参照システムでは, 当該テキストへの参照を実現する機能を解説する. 参照システムの中には,規範を作る団体が規定したものもあり,そ のような情報は,当該テキストを利用することを前提に,記録され る必要がある. また,ある参照システムは,当該電子テキストの制作者や分析者が 独自に定義したものもある.
リストや注釈といった,書誌情報の引用については,3.11 書誌項目の記述または参照で解説する. 書誌情報の引用や参照を符号化する際には,対象となる範囲が示さ れる. このような書誌情報は,自在テキスト中にある句,または書誌情報 のデータベースに相応しい構造を持つ構成要素で示される.
韻文や舞台芸術の一説を符号化するための要素は,3.12 韻文・舞台芸術中の一節で解説する.
本章の最後に,コアモジュールの構造と構成要素を概観する. この内容は,TEI文書の文書型宣言を解説する1 TEIの基礎構造と共に呼ばれ るべきである.
3.1 段落TEI: 段落¶
段落とは,全ての散文形式のテキストにおいて,基本となる構成 要素で,散文を分割する最も小さい単位である. 散文形式は,TEIテキスト中でよく使用され,韻文においても使 用される. 従って,本節で解説する段落は,全てのテキスト種で使われる要 素といえる.
段落には,本節で解説する要素以外の要素もとることが可能で, それそれのテキストの性質に特化した要素を使うことが可能であ る. 本ガイドラインでは,句レベル要素,塊レベル要素,挿入レベル 要素の3種類を想定している. 句レベル要素とは,段落の中に出現し,それ以外の場所には出現 しないものである. 塊レベル要素とは,段落の間に出現し,段落の中には出現しない ものである. 挿入レベル要素とは,段落の中,または段落の間に出現するもの である. 句レベル要素には,強調,引用句,名前,日付などが含まれる. 挿入レベル要素には,書誌情報の引用,注釈,リストなどが含ま れる. 塊レベル要素には,段落自体や,これと似た構造を持つ,例えば, 16.3 区画,分割,アンカーで解説さ れる要素abが含まれる. この要素は,ある種のテキストで段落とされる単位に相当するも のとして使用されるものである.
段落とは,様々な種類の要素の元で使われることから,その要素 内容は,当該テキストの種類により,異なってくる. とりわけ,本章では紹介していない(訳注:他のモジュールで) 付加的に使う要素は,ある種のテキスト中で使うことができるものである. 本章で解説する要素は,全てのテキスト種において使うことがで きるものである.
段落の中に,さらに下位区分を必要とするのであれば,要素 sまたは 要素seg を使うことができる. この詳細は,それぞれ 16 リンク,分割,統合と 17 簡易分析機能で解説する. 段落は,一般には,内部構造をとるものではない. 但し,段落の内容としてある散文中には,各種文字,エンティティ 参照,各種の句,リストや図表などの埋め込み要素,などが含ま れる.
西洋文化では,段落は明示されるのが一般的である. 従って,それを要素pで示すことには,争点はない.
<p>I fully appreciate Gen. Pope's splendid achievements with their
invaluable results; but you must know that Major Generalships in the
Regular Army, are not as plenty as blackberries.</p>
</body>
<p>Serbs seized more territory in this struggling new country today as
the United States Air Force ended a two-day airlift of humanitarian
aid into the capital, Sarajevo.</p>
<p>International relief workers called on European Community nations
to step up their humanitarian aid to the former Yugoslav republic,
in conjunction with new American aid flights if necessary.</p>
<p>A special envoy from the European Community, Colin Doyle, harshly
condemned the decision by Serbs to shell Sarajevo on Saturday night
during a visit to the Bosnian capital by a senior American official,
Deputy Assistant Secretary of State Ralph R. Johnson. </p>
<p>...</p>
There came to the castle the Crawling Louse. <q>Who,
who's in the castle? Who, who's in your house?</q>
said the Crawling Louse. <q>I, I, the Languishing Fly.
And who art thou?</q>
<q>I'm the Crawling Louse.</q>
</p>
<p>Then came to the castle the Leaping Flea. <q>Who,
who's in the castle?</q> said the Leaping Flea. <q>I,
I, the Languishing Fly, and I, the Crawling Louse. And
who art thou?</q>
<q>I'm the Leaping Flea.</q>
</p>
<p>Then came to the castle the Mischievous Mosquito.
<q>Who, who's in the castle?</q> said the Mischievous
Mosquito. <q>I, I, the Languishing Fly, and I, the
Crawling Louse, and I, the Leaping Flea. And who art
thou?</q>
<q>I'm the Mischievous Mosquito.</q>
</p>
- « 3.1 段落
- » 3.3 強調部分と引用
- Home | 目次
3.2 句点法TEI: 句点法¶
句点記号は,それが使用する文字集合で使えない場合や,その使用 が曖昧である時に,問題となる. ユニコード文字を使う場合に,この様な問題が起こる. 例えば,ユニコードでは,各句点記号に特定のコードを割り振り, 異なる機能を持つグリフ(例えば,ピリオド,コンマ,ハイフン)を 分けている. 例えば,「ハイフン」の中でも,マイナスの記号,単語を分離する 機能を持つ記号,自動付与される,いわゆるソフトハイフン,改行 が認められない,いわゆるハードハイフンには,異なるコードが付 与されている. 一般的ではない句点記号を符号化するには, 5 標準化されていない文字と字形の表現 で解説されている機能を使うこともできる.
ピリオド は,文の区切,省略,小数点,または数字の添えものとして使 われる. これらは,16.3 区画,分割,アンカーや, 3.5.5 略語や, 3.5.3 数値や計測値で解説される,言語的文 単位,略語,数値とは異なるものである. ピリオドと認定することには,それなりの背景があり,それは, 書記システムにあるどの文字も多義的であることと,違うもの ではない.
疑問符 と 感嘆符 は, 文の終わりを示すものであるが,時には,文中にコメント( !で驚きなどを, ?で問い合わせや言語学上の 怪しさ)として使われることもある. これらは,言語学的文単位として,区分されることもある. その場合には,文中での用法は,マークアップされないか,ま たは17.1 言語学的区分で解説される要素 cが使われる.
ダッシュ記号 は,様々な用途で使われる. 例えば,挿入,割り込み,新しい発話者(対話時),リスト項目な どを示す. 最後の2つの用例は, 3.3.3 引用で解説され る要素qと, 3.7 リストで解 説される要素item の方を使う方が,それぞれ望ましい.
引用符 は,要素q やquote を使う際には,削除されることがある. 特に,引用が必ずしも引用符で示されない場合など,様々な方法 で表現される場合である. 引用やこれに関連する素性については,3.3.3 引用を参照のこと.
アポストロフィー は,一重引用符と区別する必要がある. ハイフンと同じく,この曖昧な用例は,ユニコードでは分けて示 すことができる. 引用符の場合は,先に示したとおり,XMLのタグで明示的に示す ことができる. 一方,アポストロフィーの場合は,様々な使い方がある. 英語におけるアポストロフィーは,短縮形,(時に)複数形の表示 で使われる. これを明示的に分けることは,言語学的分析や解釈のレベルを分 けことになる.
括弧 やダッシュ記号や省略記号などは,テキストの統語上の情報を示すた めに使われることがある. これらの用例を明示的に分けることは,言語学的分析や解釈のレ ベルを分けることになる. この詳細は,17 簡易分析機能にある.
句点記号を機能別にタグを使い明示的分けるには,当該記号を,テ キストとして残すべきか,または除外すべきかを考えることになる かもしれない. 引用符の場合には,ユニコード中の記号を使い,引用の開始と,そ の終了とは,分けて記録される方が,単に要素qと属性 rendを使って示されるよりも,便利か もしれない. どちらの手法を使うかは,当該プロジェクトの目的によって決めら れる.
- « 3.2 句点法
- » 3.4 簡単な編集上の変更
- Home | 目次
3.3 強調部分と引用TEI: 強調部分と引用¶
- 強調,外国語,その他,言語上弁別されている強調
- 発話,思索,引用などの表現
- 専門用語,注解など
- » 3.3.2 強調・他言語など
- Home | 目次
3.3.1 強調部分とはTEI: 強調部分とは¶
「強調(highlighting)」とは, 印刷上の特徴(例えば,フォント,サイズ,色彩,など) により,周囲のテキストとは異なる一節であることが示された ものである. 9 強調は,一般に,読み手の関心を,ある素性に引きつけるた めに使われている. 本節では,本ガイドラインで推奨する,この様な性質を符号 化する手法を解説する.
- 外国語,方言,古風,専門用語など,一風異なっている.
- 強調表現.例えば,話されるときには強勢が付くもの.
- 本文の部分ではないもの.例えば,相互参照,タイトル,ヘ ダー,ラベルなど.
- 話線が異なるもの.例えば,無声の独白,解説のナレーションなど.
- 当該テキストの話し手ではない,テキスト中またはテキスト 外にある他の話者.例えば,直説法,引用など.
- 何らかの方法で,当該テキストからは離れているもの. 例えば,ことわざ,語られているが使われていない,古いテ キスト中にある人物名や地名,編集上の訂正や追加など.
強調されているテキストが持つ機能には,異なる場所では異なる 表現方法が採られていることもある (例えば,周囲がローマン体のテキスト中にある外国語は,イタ リック体で示されることもあるし,逆に,周囲がイタリック体の 場合は,ローマン体で示されることもある). 従って,当ガイドラインでは,表示方法の符号化と,その背景に ある機能の符号化を分けることにしている.
- hi 周囲のテキストとは見た目が異なっている語句を示す.
属性rendで使うことができる属性値 について,当ガイドラインでは,規定していない. 属性rendは,元資料中で当該テキス ト部分が表現されている様子を記録するためのものであり,その字形 は様々な表現方法,例えば,活字体,大きさなどが関連している ことから,様々な情報を記録する必要がある.
- 同種の強調でも,異なる文脈中では,異なる目的を持つこと がある.
- 同じ機能でも,異なる文脈中では,異なる強調のされ方をす ることがある.
- 分析を目的とする場合には,強調であることが示されている だけよりも,一般には,その強調が意図する機能についての 情報の方が,より有用である.
多くの場合,強調されている部分が持つ機能は,明らかであり, その分析は論点にはならない. 理由は,強調のされ方が変わるという弁別性は,当該ガイドライン の至る所で論議されている弁別性と同種のものだからである. この種の弁別性を記録する要素は,クラスmodel.emphLikeのメンバー である. このクラスに加えて,クラスmodel.hiLikeは,句レベル のクラスmodel.highlightedを構成している. このクラスのメンバーは,句レベルの要素中で,使用することが 可能である.
これら2つのクラスの区別は簡単で,要素hiと要素 emphの違いが,それをよく示している. 要素hiは,ある一節が印刷表現上異なっていることを示すための ものであるが,要素emphは,ある一節が,何らかの目的のために, 言語的に強調されていることを示すものである. これら2つは,同時に使われることも多いが,異なるものである. 但し,当該機能を符号化することが,経済的に無理な場合(例え ば,巨大なコーパス)や,知的権利上,相応しくない場合(例えば, 古い資料から転記する場合や,印刷の様子を研究するための資料 を作成する場合)があることは,知っておくべきである. このようなケースでは,要素hiや,クラスmodel.hiLikeにある 要素が使われる.
印刷上の違いを示す要素でありながら,本節では扱っていない要 素として,要素title(3.11 書誌項目の記述または参照)と,要素 name( 3.5.1 参照文字) がある.
- « 3.3.1 強調部分とは
- » 3.3.3 引用
- Home | 目次
3.3.2 強調・他言語などTEI: 強調・他言語など¶
- foreign 記述のベースで使われている言語と異なる言語による語句を定義する.
- emph 言語学的,修辞学的に強調されるべき語句を示す.
- distinct 言語上,異なる語句を示す.例えば,古語,技術語,方言,忌諱語など.ま た,特定グループでしか通用しない特殊言語など.
- » 3.3.2.2 強調
- Home | 目次
3.3.2.1 他言語TEI: 他言語¶
with <foreign xml:lang="la">propter hoc</foreign>?</q> said the Bee
Master.
<q>Wax-moth only succeed when weak bees let them in.</q>
pronounce with your mouth full.
piece of light, buttery, pastry that is usually eaten for
breakfast, especially in France.
3.3.2.2 強調TEI: 強調¶
<q>
<emph rend="italic">What does Christopher
Robin do in the morning nowadays?</emph>
</q>
whom three Realms obey,</l>
<l>Doth sometimes Counsel take —
and sometimes <emph rendition="#italic">Tea</emph>.</l>
<!-- in the header ... -->
<rendition xml:id="italic" scheme="css">text-style:italic</rendition>
要素hiは, 強調された語句の背景にある意図の判別が,難しかったり,特定が困 難であったり,それが不可能であるときに,使われる. この要素を使い,属性rendや 属性renditionを使うことで記録される情 報を,符号化することが可能になる. これにより,強調の機能を特定することなく,その事実を示すことが できる. また,この要素は,当該テキストが2段階で処理される時にも,便利 である. 例えば,1回目の処理では,表示上の区別を行い,2回目の処理で,要素 hi を特定の要素に置き換えるような場合である.
that the said <hi rend="italic">Walter Shandy</hi>, merchant,
in consideration of the said intended marriage ...
boast of the advantage over him in only one respect. They
often <hi rend="quoted">came down</hi> handsomely, and
Scrooge never did.
- « 3.3.2.2 強調
- Home | 目次
3.3.2.3 言語上,分けておきたい部分TEI: 言語上,分けておきたい部分¶
場合によっては,ある語句の言語の違いを,要素foreignを使うよりも,さらに細かく記 録しておきたいことがある. この様な場合,要素distinctを使うことができる. この要素では,属性を使った2つの手法で,言語上の異なりを示す情報を記 録することができる. 属性typeには,利用者が規定したコー ドを付加することができる. これにより,当該語句の使用領域や特殊言語を示すことになる. この属性値について,現時点では,推奨するものはない. 現場で,この値に関するコンセンサスは存在していない.
または,この他の3つの属性を組み合わせて,記述言語学で使わ れるような,例えば,Mattheier et al, 1988にあるような, 3軸の基準で記録することも可能である. 属性timeには,通時的な情報を示す. 例えば,古語,古い言い回し,最新語,斬新語など. 属性spaceには,共時的・地理的な情 報を示す. 例えば,地理的な分類による,国家,地域,国際など. 属性socialには,事情に関する情報 を示す. 例えば,社会階級による,技術的,丁寧,無礼,限定的など. 確認すると,これらの要素の値として,現時点では推奨するも のはない. 符号化する人は,ヘダー中の適切な場所に,当該スキームの解 説を記録すべきである(2.3 符号化解説).
bosom friend, a <distinct type="psSlang">fag</distinct> of
Macrea's, that there was trouble in their midst which
King <distinct type="archaic">would fain</distinct> keep
secret.
bosom friend, a
<distinct time="1900" space="GB" social="publicschool">fag</distinct>
of Macrea's, that there was trouble in their midst which
King <distinct time="archaic">would fain</distinct> keep
secret.
3.3.3 引用TEI: 引用¶
手書き・印刷テキストで頻繁に見られる表示形式のひとつに,引 用符を使ったものがある. 本節までに紹介してきた表示の方法と同様に,引用符を使ったも のも,当該テキストにある素性(例えば,直説法といった引用)と, その表示方法(例えば,引用符を使っていること)を分けて記録し た方がよい.
- q 周りのテキストとは(表面上)異なっているようにマークアッ プされている部分を示す.例えば,直接話法や思考, 技術用語や専門語,著者による区別,引用,言及され ているが使われていない一節など.
-
said
考えたり声に出されたりした一節を示す.元資料中に明示さ
れているかどうか,間接的な伝聞かどうか,実在の人
物に依るものかどうか,などは問わない.
direct 引用内容が,直接または間接的な話(法)かどうかを示す. aloud 引用内容が言語または記号化されているかどうかを示す. - quote 語り手や著者が,当該テキスト外にあるものに向けた,一節を示す.
- cit 書誌参照を伴い,他の文書からの引用を示す.例えば,辞書の場合には,当 該単語形が出現する例文を示したり,当該見出し語の翻 訳や用例を示したりする.
- mentioned 言及された語句を示す.
- soCalled 著者や語り手が,責任を持ちたくない語句を示す.例えば,英語文化圏では, 引用符号で囲んだり,イタリック体で示される部分.
引用符の一番重要な使用目的は,「引用」を示すことである. これにより,著者または話者が,当該テキストは他の話声とは異 なることを示すことになる. 要素q は,これ以上の区別が必要でないときに,使うことができる. 但し,当該一節が,周囲のテキストとはある意味で区別すべきと 感じられたときには,上記の要素を使い,それを記録することが できる. そのような典型例として,例えば,要素quoteを 使い,他の作品からの引用であることを示したり,要素saidを使 い,人や登場人物による発語や思索を表現する語句を示すことがある. 要素soCalledは, 著者や話者が,当該の語から距離を置きたい時に,その主体を特 定することなく記録するために使うことができる. 要素mentionedは,当該語句が,本文の一部 としてよりかは,本文で解説している対象となっている時に,使 うことができる.
当該一節が,周囲のテキストとは,何らかの理由で異なっている ことがはっきりとはしない,または関心がない時には,単に要素 qで示すことも可能である.
印刷物の場合,引用は,異なる字形,特別な記号(例えば,一重 引用符,二重引用符,カギ括弧,ダッシュなど)や,レイアウト (例えば,字下げされた形式段落)などで表現される. これら表示の特徴に関心がある場合には,1.3.1.1 グローバル属性に あるグローバル属性rendまたはrenditionを使い記録することができる.
引用符は,他の記号と同様に,属性rendにある情報との連携に関係なく,それ をテキスト中に残しておく方がよいと判断される場合がある. このような場合には,適切なユニコード文字を使い,それを記録 すべきである. もしユニコード文字が直接入力できない場合には,数値による文字参照( 文字参照)を使うことができる.
you?</said> — he at last said —
<said rend="PRE lsquo POST rsquo">you no speak-e,
damme, I kill-e.</said> And so saying,
the lighted tomahawk began flourishing
about me in the dark.
<said>— Alors, Albert, quoi de neuf?</said>
<said>— Pas grand-chose.</said>
<said>— Il fait beau,</said> dit Robert.
<said rend="PRE mdash">Alors,
Albert, quoi de neuf ?</said>
<said rend="PRE mdash">Pas grand-chose.</said>
<said rend="PRE mdash">Il fait beau,</said>
dit Robert.
-
att.ascribed
特定個人に帰する発話や行動を示すを示す要素に付随する.
who 当該要素の内容が示す人物を示す.
<said who="#Adolphe">— Alors, Albert,
quoi de neuf?</said>
<said who="#Albert">— Pas grand-chose.</said>
<said who="#Robert">— Il fait beau,</said>
dit Robert.
<!-- .... -->
<list type="speakers">
<item xml:id="Adolphe"/>
<item xml:id="Albert"/>
<item xml:id="Robert"/>
</list>
<said aloud="false">I mean
Gordon Macrae, for example…</said>
<said aloud="false">Jungian
Analyst with Winebox! That's what you called him, you callous bastard,
didn't you? Eh? Eh?</said>
eight weeks with this very paper in his hand, and he says:—
<said who="#WilsonSpaulding">I wish to the Lord, Mr. Wilson, that I was a
red-headed man.</said>
</said>
<!-- ... -->
<list type="speakers">
<item xml:id="Wilson">Wilson</item>
<item xml:id="WilsonSpaulding">Spaulding reported by Wilson</item>
<!-- ...-->
</list>
<said>The Lord! The Lord! It is Sakya Muni himself,</said> the lama half
sobbed; and under his breath began the wonderful Buddhist
invocation:-<said>
<quote>
<l>To Him the Way — the Law — Apart —</l>
<l>Whom Maya held beneath her heart</l>
<l>Ananda's Lord — the Bodhisat</l>
</quote>
And He is here! The Most Excellent Law is here also. My
pilgrimage is well begun. And what work! What work!</said>
</p>
<head>Chapter 1</head>
<epigraph>
<cit>
<quote>
<l>Since I can do no good because a woman</l>
<l>Reach constantly at something that is near it.</l>
</quote>
<bibl>
<title>The Maid's Tragedy</title>
<author>Beaumont and Fletcher</author>
</bibl>
</cit>
</epigraph>
<p>Miss Brooke had that kind of beauty which seems to be thrown into
relief by poor dress...</p>
</div>
work of followers of J.R. Firth, probably best summarized
in his slogan, <cit>
<quote>You shall know a word by the company it keeps.</quote>
<ref>(Firth, 1957)</ref>
</cit>
- 引用部分を下位区分に分けて,各下位区分を段落の中に埋め込む.
- 当該引用部分を,スタンドオフスタイル(訳注:20章を参照)で記録する.
- 当該引用部分の境界を,空要素で示す.
sentences are finite objects was never justified by arguments from
the attested properties of NLs, it did have a certain
<soCalled>social</soCalled> justification. It was commonly assumed in
works on logic until fairly recently that the notion
<mentioned>language</mentioned> is necessarily restricted to finite
strings.
3.3.4 用語,注釈語,同等語,解説TEI: Terms, Glosses, Equivalents, and Descriptions¶
本節では,注釈語や,代替の用語や解説などの扱いについて紹介する.
要素termは,要素glossを選択的に伴うことで, 要素mentionedと同じものとして使うこと ができる. 要素glossが使われている時には,属性 targetに,解説の対象と案ル用語への リンクが記される. このリンクは, 要素term, または要素mentionedに,属性値xml:idを付与し, その属性値にある識別子を,要素glossにある属性targetの属性値として付与することで成立す る. 以下にある例では,この機能を使っている. この様な,TEI文書中におけるリンクに関する詳細は, 16 リンク,分割,統合にある.
as <gloss target="#TDPv">the relationship, expressed through discourse
structure, between the implied author or some other addresser,
and the fiction.</gloss>
structure from grammatical strings of words</gloss> is known as a
<term xml:id="PRSR">parser</term>, and much of the history of NLP over the
last 20 years has been occupied with the design of parsers.
form like <mentioned xml:id="cw234" xml:lang="grc">eluthemen</mentioned>
<gloss target="#cw234">we were released,</gloss> accented on the
second syllable of the word, and its participial derivative
<mentioned xml:id="cw235" xml:lang="grc">lutheis</mentioned>
<gloss target="#cw235">released,</gloss> accented on the last.
- altIdent 特定言語において,XMLの要素,クラス,属性などで推奨される名前を示す.
- desc 当該要素,属性,属性値を採用した目的の簡単な解説を示す.
-
equiv
親要素と同等とされる構成要素を,相互参照または外部リンクで示す.
uri 外部識別子によって親要素の意義を表す. filter 当該要素を標準的XMLデータに変形する外部スクリプトへの参照を示す. name 親要素の意義を表す.
<gloss>anonymous block</gloss>
<!--... -->
</elementSpec>
<valItem ident="susp">
<gloss>suspension</gloss>
<desc>the abbreviation provides the first letter(s)
of the word or phrase, omitting the remainder.</desc>
</valItem>
<valItem ident="contr">
<gloss>contraction</gloss>
<desc>the abbreviation omits some letter(s) in the middle.</desc>
</valItem>
<!--...-->
</valList>
<equiv name="E69" uri="http://cidoc.ics.forth.gr/"/>
<!--... -->
</elementSpec>
<equiv
filter="http://www.example.com/equiv-filter.xsl"
mimeType="text/xsl"
name="bold"/>
<gloss>bold</gloss>
<desc>contains a sequence of characters rendered in a bold face.</desc>
<!-- ... -->
</elementSpec>
<altIdent xml:lang="de">Abkürzung</altIdent>
<!--...-->
</elementSpec>
<attList>
<attDef mode="change" ident="url">
<altIdent>href</altIdent>
</attDef>
<!-- .... -->
</attList>
</elementSpec>
既定値では,要素altIdentのは,属性identの値と同一である.
<!--...-->
<desc>identifies a word or phrase as belonging to some language other
than that of the surrounding text. </desc>
<!--...-->
</elementSpec>
- « 3.3.4 用語,注釈,同等語,解説
- Home | 目次
3.3.5 例TEI: 例¶
最初の文にある斜体で印刷されている句は,強調であることを記録 すると,例えば,以下のようになる.On the one hand the Nibelungenlied is associated with the new rise of romance of twelfth-centuryFrance, the romans d'antiquité , the romances of Chrétien de Troyes, and the Germanadaptations of these works by Heinrich van Veldeke, Hartmann von Aue, and Wolfram von Eschenbach.
associated with the new rise of romance of twelfth-century France,
the <hi xml:lang="fr" rend="italic">romans d'antiquité</hi>,
the romances of Chrétien de Troyes, ...
is associated with the new rise of romance of twelfth-century France,
the <foreign rend="italic">romans d'antiquité</foreign>, the
romances of Chrétien de Troyes, ...
A pretty common case, I believe; in all vehement debatings. She says I am too witty; Anglicé, too pert; I, that she is too wise; that is to say, being likewise put into English, not so young as she has been: in short, she is grown so much into a mother, that she had forgotten she ever was a daughter. ...
この例において,vehementの斜体 と,not so young as she has beenの斜体は,明らかに異なるものである. 前者は強調のため,後者はよく使われる一節の為である. また,too wiseや too pertや too wittyには, 皮肉が込められている. これら解説の対象となる句は,専門用語でも,引用された語で もないが,引用句として扱われている. それは,作者が,その句が,主人公やその母に語らせているからであ る. 「mother」と 「daughter」が斜体で示されてい るのは,これらを対比させるためである. ここまでの解説で,これに相応しい分類はない. 「Anglicé」は,英語ではないと考 えられるが,斜体になっていないことに注意して欲しい.
debatings. She says I am <q rend="italic">too witty</q>;
<foreign xml:lang="la" rend="roman">Anglicé</foreign>,
<gloss rend="italic">too pert</gloss>; I, that she is
<q rend="italic"> too wise</q>; that is to say, being likewise
put into English, <gloss rend="italic">not so young as she has
been</gloss>: in short, she is grown so much into a
<hi rend="italic">mother</hi>, that she had forgotten she ever
was a <hi rend="italic">daughter</hi>.
- « 3.3 強調部分と引用
- » 3.5 名前,数値,日付,略語,住所
- Home | 目次
3.4 簡単な編集上の変更TEI: 簡単な編集上の変更¶
印刷物を編集する際と同じく,電子テキストを編集する際にも,編 集の際に注釈をテキストに加えたり,当該テキストが変更されたこ とを示す必要があることもある. 本節では,この様な,編集の際に介入したことを記録するための要 素を解説する. 例えば,挿入された情報は,誰によってなされたのか,符号化する 人か,電子化の元資料となった印刷物の編集者か,それより以前の 編集者か,写本の筆写者か,などを示すためのものである.
本節で解説される要素は,ごく一般的な編集上の介入やコメントに ついてのみ対応するするものである. この他の,構造化されていないコメントについては, 3.8 注釈と索引にある 要素note で記録することになる. より構造化された解釈的注釈については, 16 リンク,分割,統合で解説されているよ うな,各種の手法で記録することが可能である. 本節で紹介する用例では,ごく簡単な編集上の介入を扱っている. 特に,短いテキスト部分に異なる読みが可能である場合の,簡単な 符号化の方法を紹介する. あるテキストの広範囲で散在し,多くの解釈を符号化する必要があ る場合には,16 リンク,分割,統合で紹介する仕組みを 使うべきである. あるテキスト部分の実現形が複数ある場合, 12 校本で紹介する, 校本向けの仕組みを使うことができる.
-
att.editLike
学術的調整・解釈の性質を表す属性を示す.
cert 当該解釈や調整の確信度を示す. resp 当該解釈や調整の責任者を示す.例えば,編集者,翻訳者など. evidence 当該解釈や調整の信頼度や正確さを判断する証拠を示す.
- choice テキスト中の同じ場所で,異なる符号化記述をまとめる.
この様にまとめて使うことができる要素は,クラス model.choicePartのメ ンバーである. このクラスのメンバーには,要素 sic , corr , reg , orig , unclear , add , del がある. これら要素の機能や使い方は,以下で解説する.
- 明らかな間違いを指摘または修正.
- 異形態,不規則形,一般的でない形,変わった形を指摘または 正規化.
- 編集上の追加,一部修正,削除.
転記や編集の際に使われる要素の,より詳細な解説は, 11 Representation of Primary Sourcesにある.
3.4.1 明らかな間違いTEI: 明らかな間違い¶
Another property of computer-assisted historicalresearch is that data modelling must permit any one textual feature orpart of a textual feature to be a part of more than one informationmodel and to allow the researcher to draw on several such modelssimultaneously, for example, to select from a machine-readable textthose marginal comments which indicate that the date's mentioned in themain body of the text are incorrect.
mentioned in the main body of the text are incorrect.
mentioned in the main body of the text are incorrect.
<choice>
<corr>dates</corr>
<sic>date's</sic>
</choice> mentioned in the main body of the text are
incorrect.
<choice>
<corr resp="#msm">dates</corr>
<sic>date's</sic>
</choice> mentioned in the main body of the text are
incorrect.
<!-- within the header for this document ... -->
<respStmt>
<resp>editor</resp>
<name xml:id="msm">C.M. Sperberg McQueen</name>
</respStmt>
<corr cert="high">Autumn</corr>
<sic>Antony</sic>
</choice> it was,
That grew the more by reaping
この例のように,元のテキストにはない修正が付加されている場合, それは要素corrに記録されるべきである. また,当該修正が,元資料に既に含まれており,そこには追加・修正 の痕跡が読み取れる場合には,それらを要素addや要素 delで記録す べきである. これらの詳細は,3.4.3 追加,削除,省略にあ る. 当該修正は,編集上付加されたもので,元資料には,物理的な損傷ま たは読み取れない理由から存在していない場合には,要素supplied で記録することができる. 当該修正が,省略語を省略なしへと変更しただけのものであれば,要 素exで記録す ることができる. このような,著者や筆写者の仕事に対して,編集の過程で何らかの介 入をしたことを記録する要素については, 11 Representation of Primary Sources に詳しく解説してある.
- « 3.4.1 明らかな間違い
- » 3.4.3 追加,削除,省略
- Home | 目次
3.4.2 正規化TEI: 正規化¶
符号化する元資料に,一般的ではない綴りなどの異形が多く使われ ている場合には,様々な理由から,それを「正規化」したい時があ る. つまり,そのような異形を,それと同等とされる「規格」「正規」 形へと書き換えるのである. 11
これらの要素にある情報を使うソフトとしては,例えば,初心者や 学習者向けのもの,綴りの違いは問題とならない言語研究,綴り辞 典などが考えられる.
how godly a dede it is to overthrowe so wicked a racethe world may judge: for my part I thinke there canotbe a greater sacryfice to God.
<orig>overthrowe</orig> so wicked a race the
world may judge: for my part I <orig>thinke</orig>
there <orig>canot</orig> be a greater
<orig>sacryfice</orig> to God</p>
<reg>overthrow</reg> so wicked a race the
world may judge: for my part I <reg>think</reg>
there <reg>cannot</reg> be a greater
<reg>sacrifice</reg> to God.</p>
<orig>dede</orig>
<reg>deed</reg>
</choice> it is to
<choice>
<orig>overthrowe</orig>
<reg>overthrow</reg>
</choice> so wicked a race the
world may judge: for my part I <choice>
<orig>thinke</orig>
<reg>think</reg>
</choice>
there <choice>
<orig>canot</orig>
<reg>cannot</reg>
</choice> be a greater
<choice>
<orig>sacryfice</orig>
<reg>sacrifice</reg>
</choice> to God.</p>
<choice>
<orig>dura</orig>
<reg resp="#MSM">dyra</reg>
</choice>
3.4.3 追加,削除,省略TEI: Additions, Deletions, and Omissions¶
-
gap
TEIヘダーにある編集上の理由,または当該資料が判読できな
い・聞こえな いことを理由に,転記の際に省略された部分の
場所を示す.
reason 省略の理由を示す.例えば, 見本, 聞こえない, 無関 係, 取り消し, 取り消しがありかつ判読できない,など. -
unclear
元資料からは判読できないまたは聞こえないという理由で,確実に転記でき
ない語句や一節を示す.
reason 当該資料から転記が困難である理由を示す. - add 著者,筆写者,注釈者,校正者による,文字,単語,句レベルでのテキスト 挿入を示す.
- del 著者・筆写者・注釈者・校正者により,削除または削除として符号化または 余分なものまたは間違いとして示されている,文字,単語,句を示す.
<desc>irrelevant commentary</desc>
</gap>
<gap reason="sampling" extent="2" unit="cm">
<desc>astrological figure</desc>
</gap>
That is, there were two stars on the easterly side and one to the west; …
要素addと要素delは,語句が追加・削除されている場所を 示すために使われる. 但し,この2つの要素は,いくつもの要素をまたぐような,長めの部 分に使うのは,適切ではない. そのような場合には,11.3.4 Additions and Deletionsで解説する 要素addSpan と要素delSpanを使うことになる.
and as to the consequences <add place="supralinear">of
these facts</add> from which this tale takes its title.
要素addは,編集上の変更を示すためには使うべきでは ない. 例えば,元テキストでは間違いのために省略されているものを編集上 補完したものや,別の版には存在する一節を付加したような変更が, これに該当する. この様な追加には,要素corrまたは要素supplied を使うべきである. この詳細は,それぞれ3.4.1 明らかな間違いと11.3.3 Correction and Conjectureで解説してある.
要素unclearは,元資料にある一節が,確信を持っ ては読めない場所,または転記者が何らかの理由で確信を持てない場 所を記録するために使われる. 例えば,部分的に聞こえなかったり,読めなかったりする場合である. 属性reasonと属性respは,要素gapと共に使われて,この様な不確実な理由 や,読みを推測した責任者を記録することができる.
<l>
<unclear reason="ink blot">The</unclear> sea between
yet hence his pray'r prevail'd
</l>
全く読めない・聞き取れないような場合には,先述の要素gapを使うべき である.
<l>I live in the middle of England</l>
<l>But!</l>
<l>Norway! My soul resides in your watery
<del type="overstrike">fiords fyords fiiords</del>
</l>
<l>Inlets.</l>
<del type="overtyped">Mein</del> Frisch
<del type="overstrike">schwebt</del> weht der Wind
</l>
<del type="overstrike">Inviolable</del>
<add place="infralinear">Inexplicable</add>
splendour of Corinthian white and gold
</l>
要素delは,元資料の当該部分が,確信を持っては読め ない,または全く読めない部分や,転記者や編集者が何らかの理由で 省略したような部分には使うべきではない. 確信を持っては読めない部分は,要素unclearに 属性reasonを伴い,その困難な理由と共 に,記録されるべきである. 転記者や編集者が省略した部分は,要素gapで示すことができる.
- « 3.4 簡単な編集上の変更
- » 3.6 簡単なリンクと相互参照
- Home | 目次
3.5 名前,数値,日付,略語,住所TEI: Names, Numbers, Dates, Abbreviations, and Addresses¶
本節では,周囲のテキストからは区別した方が便利なテキスト素性に ついて解説する. とりわけ,名前,日付,数値は,データベースの情報となる場合に は,研究者にとって重要となる. これらを周囲のテキストとは区別しておくことは,語彙に関心を持 つ研究者にとっても重要である.
本節では,このようなテキスト素性の全ては解説されない. 名前,数値,計測値,日付などについては,名前モジュールで扱わ れる(13 名前,日付,人物,場所を参照).
3.5.1 参照文字TEI: 参照文字¶
<q>My dear
<rs type="person">Mr. Bennet</rs>
</q>, said his lady to
him one day, <q>have you heard that <rs type="place">Netherfield Park</rs> is let at last?</q>
</p>
<rs type="organization">Watering Committee</rs>.
They were paid a commission not exceeding four per
cent, and gave bond.</p>
<rs type="org">Circumlocution Office</rs> never, on any
account whatsoever, to give a straightforward answer,
<rs type="person">Mr Barnacle</rs> said, <q>Possibly.</q>
</p>
<q>My dear <rs type="person">Mr. Bennet</rs>
</q>, said
<rs type="person">his lady</rs> to him one day ...
</p>
<q>My dear <name type="person">Mr. Bennet</name>,</q> said <rs type="person">his lady</rs> to him one day,
<q>have you heard that <name type="place">Netherfield Park</name> is let at last?</q>
</p>
名前としてタグ付けしただけでは,個人の名前を,参照を目的とした 規範名へと変換する際に,十分とはいえない. 当該テキスト中にある名前は,綴りは必ずしも同じではなく,部分的 であったり,曖昧だったりすることがある. また,名前には接辞,例えば,van とかdelaが付くこともあり,これ らは,参照形の一部としてあることもある. これらは,言語や国に依存するものである.
ここで,2つの問題を提示しよう. ひとつは,元資料にある形とは異なる,正規化された名前を使うべき だろうか. もうひとつは,正規化されていることとは無関係に,当該の名前が示 す人物や場所などを特定すべきだろうか. 3.4.2 正規化で紹介さ れている要素regは,前者の問題に対応する要素である. また,属性keyは,後者の問題に対応する 属性である.
-
att.naming
名前,人物,場所,組織を示す要素に付与される属性を示す.
key 名前で特定できる実体の名前を示す.例えばデータベース におけるレコードのキーなどのトークン.
<q>My dear <rs key="BENM1" type="person"> Mr. Bennet</rs>,</q>
said <rs key="BENM2" type="person">his lady</rs> to him one day,
<q>have you heard that <rs key="NETP1" type="place">Netherfield
Park</rs> is let at last?</q>
</p>
<name key="VOM1" type="person">Mme. de Volanges</name> marie <rs key="VOM2">sa fille</rs>: c'est encore un secret;
mais elle m'en a fait part hier.
</p>
属性keyの属性値は,上例のように,簡略 化されたコードとしても使うことができる. また,もう少し便利なことは,当該要素により名前が付与されたエン ティティについての情報を提供する他の資料を参照することである. そこには,当該エンティティ向けの多様な名前を記録することができ る.
the administration of <rs key="POJA1" type="person">Col. Polk
(<reg>Polk, James K.</reg>)</rs> has but poorly compensated me for the
suspended enjoyments and pursuits of private and professional
spheres</p>
<name key="WADLM1" type="person">
<choice>
<sic>Walter de la Mare</sic>
<reg>de la Mare, Walter</reg>
</choice>
</name>
was born at <name key="Ch1" type="place">Charlton</name>, in
<name key="KT1" type="county">Kent</name>, in 1873.
</p>
<name type="place">Montaillou</name> is not a large parish.
At the time of the events which led to
<name type="person">Fournier<index>
<term>Benedict XII, Pope of Avignon (Jacques Fournier)</term>
</index>
</name>'s
investigations, the local population consisted of between 200 and 250 inhabitants.
</p>
- « 3.5.1 参照文字
- » 3.5.3 数値や計測値
- Home | 目次
3.5.2 住所TEI: 住所¶
- addrLine 住所情報を記述する行を示す.
<addrLine>110 Southmoor Road,</addrLine>
<addrLine>Oxford OX2 6RB,</addrLine>
<addrLine>UK</addrLine>
</address>
- street 住所情報としての,通りを表す完全情報を示す.建物の名前や番号,通りの 名前など.
-
name
固有名詞.
type 当該テキストで名付けられた対象の種類を示す. - postCode 郵便の配達や区分けを簡単にするための,郵便の宛名情報の部分となる数値 または文字を含む.
- postBox 郵便配達で識別子となる,通り名以外の,数値などを示す.
- model.nameLike 人物,場所,団体に名前を付与する,または参照する要素をまとめる.
- model.persNamePart 個人名の部分を構成する要素をまとめる.
- model.placeNamePart 場所名の部分となる要素をまとめる.
住所を示す為の,短い略記号(例えば,地域や州を示すもの)が使われ ている場合には,その正式な名前を,当該要素の内容に記録した方が よい. 但し,その略記号は,グローバル属性nに 記録しておいた方がよい. それにより,(例えば),それ用のラベルを用意してあるソフトウェア が,必要な情報をそこから見いだすことができるようになる. 住所を構成する他の構成要素は,一般的な用途向けの要素nameを使い, 記録することも可能である. または,(名前モジュールが導入されているのであれば)より名前に特化した 要素を使うことも可能である.
<street>110 Southmoor Road</street>
<name type="city">Oxford</name>
<postCode>OX2 6RB</postCode>
<name type="country">United Kingdom</name>
</address>
<name type="org">Università di Bologna</name>
<name type="country">Italy</name>
<postCode>40126</postCode>
<name type="city">Bologna</name>
<street>via Marsala 24</street>
</address>
地名の正規化については,3.5 名前,数値,日付,略語,住所(訳注: 13 名前,日付,人物,場所の間違いだ ろう)を参照のこと. 郵便用アドレスには,上記にある,一般的な用途向けの要素 nameで示されている名前が含まれること もある.
<street>110 Southmoor Road</street>
<settlement>Oxford</settlement>
<postCode>OX2 6RB</postCode>
<country>United Kingdom</country>
</address>
- « 3.5.2 住所
- » 3.5.4 日付や時間
- Home | 目次
3.5.3 数値や計測値TEI: Numbers andMeasures¶
-
num
各種形式による数値を示す.
type 数値の種類を示す. value 標準的な形式で数値を示す. - measure
ある対象や商品の大きさを表す語句を示す.一般には,数値,
単位,商品名を含む.
type 当該計測種類を示す. - measureGrp 大きさに関する規格を示す.例えば,手書き資料のページの高さや幅などを 示すためのもの.
名前や略語と同様に,数値はテキスト中の至る所で使われる. 数値は,文字と数字で記録される(例えば, twenty-oneや xxiや 21など). また,これらの表現は,言語により異なる(例えば, 英語では「5th」と書き,ギリシャ語 では「5.」と書く. また,英語では, 「123,456.78」と表記するものが, フランス語では「123.456,78」と表 記される).
また,多くのソフトウェア,例えば,自然言語処理や自動翻訳にお いては,数値は,テキスト中にある他の「単語」とは同じく見なされない. そのような用途向けに,要素numがあり,これにより,周囲のテキ ストと数値を分けることができる. また,あるソフトウェアにおいては,正規化された数値を必要とす るかもしれない この場合には,要素numを使い,正規化された数値を記録する ことができる.
<num type="cardinal" value="21">twenty-one</num>
<num type="percentage" value="10">ten percent</num>
<num type="percentage" value="10">10%</num>
<num type="ordinal" value="5">5th</num>
<num type="fraction" value="0.5">1/2</num>
計測値は,詳細に表現される時には,数値や,計測単位を示す語句や, 計測される対象を示す語句などから構成される. これら全てが必要になるとは限らない. 但し,これらを,周囲のテキストからは分けておくことには,2つの 利点がある. まず,計測値は,符号化する人にとっては,単語としては認定できな い,簡略化された特定の表記方法や表記システムが使われることがある. そして,数量を扱うソフトウェアでは,それらの計測値を,計算する ために,内部の構成要素を分離・正規化することがある.
<list type="gloss">
<label>Age</label>
<item>Unimportant</item>
<label>Head</label>
<item>Small and round</item>
<label>Eyes</label>
<item>Green</item>
<label>Complexion</label>
<item>White</item>
<label>Hair</label>
<item>yellow</item>
<label>Features</label>
<item>Mobile</item>
<label>Neck</label>
<item>
<measure>13¾"</measure>
</item>
<label>Upper arm</label>
<item>
<measure>11"</measure>
</item>
<!--...-->
</list>
<!-- ... -->
</div>
<measure type="currency">12s 6d</measure>...</p>
- att.measurement
正規化単位を表す属性を示す.
quantity 計測単位の数を示す. unit 一般には標準記号により,計測単位を示す. commodity 計測される対象を示す.
<item>
<measure
type="volume"
quantity="2"
unit="bag"
commodity="hops"> ii bags hops </measure>
</item>
<item>
<measure
type="volume"
quantity="6"
unit="truss"
commodity="cloth"> six trusses Woolen and linen goods </measure>
</item>
<item>
<measure
type="weight"
quantity="5"
unit="ton"
commodity="coal"> 5 tonnes coale
</measure>
</item>
</list>
<measure type="height" quantity="14">xiv</measure>
<measure type="width" quantity="5">v</measure>
<measure type="depth" quantity="10">x</measure>
</measureGrp>
- « 3.5.3 数値や計測値
- » 3.5.5 略語
- Home | 目次
3.5.4 日付や時間TEI: 日付や時間¶
-
att.datable.w3c
W3Cに従い,時間事象の正規化方法を示す属性を示す.
when 日付や時間を,標準形式で示す.
日付は,テキスト中の至る所で出現するが,ある場面(例えば,書 誌情報)においては,それを符号買うすることが推奨または必須と なる. 時間も,至る所で出現するが,その符号化は,一般には選択的であ る.
部分的な日付または時間情報(例えば 1990年, 1990年9月, 12時ごろなど)は, 属性valueに記録することができる. 厳密ではない日付や時間情報(例えば,8月上旬, 10時と12時の間)は, 時間幅として記録することができる. 時間幅の一端が明らかである時(例えば, 12:30前, ハロウィンから数日後)には, 属性exactを使い,それを記録すること ができる.
日付や時間について,その正確さではなく,その確信度が問題とな る場合には,符号化する人はその事実を,21 確信度・責任にある仕組みを使い記録すべき である.
これらの仕組みは,確信のある日付や時間情報を詳細に記録する際 に,便利である. 日付や時間情報の一部分を符号化する時や,時間表現をより詳細に 分析する時には,本節で紹介する簡単な仕組みよりも, 13 名前,日付,人物,場所で解説する仕組みを使うべきである.
in the Year of Our Lord One Thousand Nine Hundred and
Seventy-seven of the Republic the Two Hundredth and first
and of the University the Eighty-Sixth.</date>
year 2001</date>
<date when="2001-09">September 2001</date>
<date when="2001-09-11">11 Sept 01</date>
<date when="--09-11">9/11</date>
<date when="--09">September</date>
<date when="---11">Eleventh of the month</date>
<time when="08:48:00">8:48</time>
<date when="2001-09-11T12:48:00">Sept 11th, 12 minutes before 9 am</date>
<date from="1918" to="1923">1918 to 1923</date>
— had been, he suspected,
somehow very important.</p>
manuscript (Codex Regius 2365) from <date notBefore="1250" notAfter="1300">the second half of the thirteenth
century</date>, and <title>Hervarar
saga</title> dates from <date when="1300">around 1300</date>.</p>
属性calendarは,どの暦システムにおい ても,日付を記録するために使うことができる. もし属性valueに値が付与されている場合 には,それはグレゴリオ暦の日付と解釈すべきである.
- « 3.5.4 日付や時間
- Home | 目次
3.5.5 略語TEI: 略語¶
<abbr>CC</abbr> is defined by that calibration of values which
motivates the elements of its <abbr>GSP</abbr>; ...
languages is currently nailing on <abbr>OOP</abbr> extensions.
the Director of the <abbr type="acronym">CTI</abbr> Centre for Textual Studies.
the Director of the <abbr>CTI</abbr> Centre for Textual Studies.
<choice>
<expan>World Wide Web Consortium</expan>
<abbr>W3C</abbr>
</choice>
<abbr>RELAXNG</abbr>
<expan>regular
language for <choice>
<abbr>XML</abbr>
<expan>extensible markup
language</expan>
</choice>, next
generation</expan>
</choice>
省略形は,とりわけ写本やその他の元資料においては,重要な素性と なる. 省略形の転記には,本節で解説した,簡単な要素を使うよりも,より 細かな取り扱いが求められる. この詳細については,11.3 Altered, Corrected, and Erroneous Textsで解説する. そこでは,転記モジュールで使われる要素が解説されている.
- « 3.5 名前,数値,日付,略語,住所
- » 3.7 リスト
- Home | 目次
3.6 簡単なリンクと相互参照TEI: 簡単なリンクと相互参照¶
相互参照,すなわち文書中のある場所から他の複数の場所へのリン クは,本節で解説する,要素ptrと要素ref で符号化することができる. この2つの要素は共に,この要素が出現する文書中の場所から,他 の場所(時に複数の場所)を「指示する」ことになる. それらの場所は,属性targetで示され る. リンクを表現する仕組みは,他にもいくつかあり,その詳細は,16 リンク,分割,統合にあ る.
for the complete XPointer specification, see
<ptr target="http://www.w3.org/TR/xptr-framework/"/>,
<ptr target="http://www.w3.org/TR/xptr-element/"/>,
<ptr target="http://www.w3.org/TR/xptr-xmlns/"/>, and
<ptr target="http://www.w3.org/TR/xptr-xpointer/#xpointer(id('chum')/quote)"/>;
for a discussion of TEI schemes for XPointer, see
<ptr target="#SATS"/>.</p>
一般的なリンクに関する解説は,16 リンク,分割,統合を参照のこと. XPointerの詳細な解説は, http://www.w3.org/TR/xptr-framework/や, http://www.w3.org/TR/xptr-element/, http://www.w3.org/TR/xptr-xmlns/, http://www.w3.org/TR/xptr-xpointer/#xpointer(id('chum')/quote) を参照のこと. XPointerとTEIスキームとの関連については, 16.2.4 TEI XPointer Schemesを参照のこと.
- att.pointing
URIにより要素を参照する要素に共通して付与される属性を定
義する.
type 当該ポインタの種類を示す. evaluate 当該ポインタの参照先がポインタである場合,その意図を示す.
<!-- ... -->
</div1>
<item>Saints aid rejected in mel. <ptr target="#p299"/>
</item>
<item>Sallets censured <ptr target="#p143 #p144"/>
</item>
<item>Sanguine mel. signs <ptr target="#p263"/>
</item>
<item>Scilla or sea onyon, a purger of mel. <ptr target="#p442"/>
</item>
</list>
...
<pb xml:id="p144"/>
...
<pb xml:id="p263"/>
...
<pb xml:id="p299"/>
...
<pb xml:id="p442"/>
...
<term rend="ldquo rdquo">rewriting systems</term>, have a long history
among mathematicians, but the specific form of <ptr target="#fig22"/>
was first studied extensively by Chomsky <ptr type="bibliog" target="#chom59"/>.
<!-- ... -->
<figure xml:id="fig22">
<!-- ... -->
</figure>
<!-- elsewhere, in the bibliography -->
<bibl xml:id="chom59">
<!-- citation for the book referenced above -->
</bibl>
要素ptrと要素refは, これまで本節で解説している相互参照を示す以上の目的で,使うこと ができる. 16 リンク,分割,統合や, 17 簡易分析機能や, 18 素性構造で解説する,分 析向けの手法を使うことで,テキストによる分析を対象とリンク付 けたり,対応する部分を繋げたり,時間など他の軸が異なるテキス トを統合したりすることができる.
- « 3.6 簡単なリンクと相互参照
- » 3.8 注釈と索引
- Home | 目次
3.7 リストTEI: リスト¶
要素list には,各種のリストが記録される. 例えば,数値,文字,箇条書き記号などで示されたものが対象とな る. 元資料にリストとして記録されているものは,普通は,属性typeと共に,この要素で記録される. 追い込みテキストとして示されているリストも,適切であると判断 されれば,この要素で記録することができる.
the composition of six, or at least of five quartos.
<list rend="runon" type="ordered">
<label>(1)</label>
<item>My first rough manuscript, without any
intermediate copy, has been sent to the press.</item>
<label>(2)</label>
<item>Not a sheet has been seen by any human
eyes, excepting those of the author and the printer:
the faults and the merits are exclusively my own.</item>
</list>
the composition of six, or at least of five quartos.
<list rend="runon" type="ordered">
<item n="1">My first rough manuscript, without any
intermediate copy, has been sent to the press.</item>
<item n="2">Not a sheet has been seen by any human
eyes, excepting those of the author and the printer:
the faults and the merits are exclusively my own.</item>
</list>
<list>
<item n="a">those that belong to the Emperor, </item>
<item n="b">embalmed ones, </item>
<item n="c">those that are trained, </item>
<item n="d">suckling pigs, </item>
<item n="e">mermaids, </item>
<item n="f">fabulous ones, </item>
<item n="g">stray dogs, </item>
<item n="h">those that are included in this classification, </item>
<item n="i">those that tremble as if they were mad, </item>
<item n="j">innumerable ones, </item>
<item n="k">those drawn with a very fine camel's-hair brush, </item>
<item n="l">others, </item>
<item n="m">those that have just broken a flower vase, </item>
<item n="n">those that resemble flies from a distance. </item>
</list>
<head>Report of the conduct and progress of Ernest Pontifex.
Upper Vth form — half term ending Midsummer 1851</head>
<label>Classics</label>
<item>Idle listless and unimproving</item>
<label>Mathematics</label>
<item>ditto</item>
<label>Divinity</label>
<item>ditto</item>
<label>Conduct in house</label>
<item>Orderly</item>
<label>General conduct</label>
<item>Not satisfactory, on account of his great
unpunctuality and inattention to duties</item>
</list>
<head>Unit Three — Vocabulary</head>
<label xml:lang="la">acerbus, -a, -um </label>
<item>bitter, harsh</item>
<label xml:lang="la">ager, agrī, M. </label>
<item>field</item>
<label xml:lang="la">audiō, īre,
īvī, ītus </label>
<item>hear, listen (to)</item>
<label xml:lang="la">bellum, -ī, N. </label>
<item>war</item>
<label xml:lang="la">bonus, -a, -um </label>
<item>good</item>
</list>
<head>Unit Three — Vocabulary</head>
<label>
<term xml:lang="la">acerbus, -a, -um</term>
</label>
<item>
<gloss>bitter, harsh</gloss>
</item>
<label>
<term xml:lang="la">ager, agrī, M. </term>
</label>
<item>
<gloss>field</gloss>
</item>
<label>
<term xml:lang="la">audiō, -īre, -īvī, -ītus</term>
</label>
<item>
<gloss>hear, listen (to)</gloss>
</item>
<label>
<term xml:lang="la">bellum, -ī, N. </term>
</label>
<item>
<gloss>war</gloss>
</item>
<label>
<term xml:lang="la">bonus, -a, -um</term>
</label>
<item>
<gloss>good</gloss>
</item>
</list>
preferable to the use of a worn-out expression.
<list type="gloss">
<headLabel>TRITE</headLabel>
<headItem>SIMPLE, STRAIGHTFORWARD</headItem>
<label>bury the hatchet </label>
<item>stop fighting, make peace</item>
<label>at loose ends </label>
<item>disorganized</item>
<label>on speaking terms </label>
<item>friendly</item>
<label>fair and square </label>
<item>completely honest</item>
<label>at death's door </label>
<item>near death</item>
</list>
<label>EVIL</label>
<item>
<list type="simple">
<item>I am cast upon a horrible desolate island, void
of all hope of recovery.</item>
<item>I am singled out and separated as it were from
all the world to be miserable.</item>
<item>I am divided from mankind — a solitaire; one
banished from human society.</item>
</list>
</item>
<label>GOOD</label>
<item>
<list type="simple">
<item>But I am alive; and not drowned, as all my
ship's company were.</item>
<item>But I am singled out, too, from all the ship's
crew, to be spared from death...</item>
<item>But I am not starved, and perishing on a barren place,
affording no sustenances....</item>
</list>
</item>
</list>
この手法を使い,異なる種類のリストを,任意の深さで入れ子化する ことも可能である.
- « 3.7 リスト
- » 3.9 図等の非テキスト内容
- Home | 目次
3.8 注釈と索引TEI: 注釈, Annotation, and Indexing¶
3.8.1 注釈TEI: 注釈¶
- note 注釈・コメント.
「注釈」とは,テキスト中で付加されたコ メントで,本文とは別の流れを作るものとして,記録されるもの である. 注釈は,それが割注や,脚注,傍注,章末や巻末にまとめられ た注釈であっても,これらは全て,同じ要素noteで 記録されるべきである.
注釈には,異なる人物や異なる文字で書かれたものや,著者によ る注釈や,編集者が後で付けた注釈などもある. これらの違いは,以下で紹介するように,属性を使い記録するこ とができる.
可能であれば,注釈の文は,それが本文中に挿入されるべき場所 に,まずその指標が示され,同時に,そこに埋め込まれるべきで ある. 但し,例えば,傍注の場合には,これを埋め込むことはできない. 簡単な方法は,該当する段落や要素の前に傍注の場所を示すことである. 但し,ある場合には,注釈を付加する場所にそれを転記するので はなく,それが表示されるときの場所(例えば,巻末や章末など. 一般に脚注はこれに該当しない)に記録することがある. このような場合には,属性targetや 属性targetEndを使い,その場所を特 定すべきである. また,ある場合には,注釈の場所を明示せずに,あるテキストの 範囲で示すこともある. これらについては,3.6 簡単なリンクと相互参照を参照のこと.
<l>And from my neck so free</l>
<l>The albatross fell off, and sank</l>
<l>Like lead into the sea.
<note type="auth" place="margin">The spell begins to break</note>
</l>
of any sort.<note n="1" place="foot">We explain below why we use
the uncommon term <mentioned>collection</mentioned>
instead of the expected <mentioned>set</mentioned>.
Our usage corresponds to the <mentioned>aggregate</mentioned> of many
mathematical writings and to the sense of <mentioned>class</mentioned>
found in older logical writings.</note> The elements ...
元資料にある注釈を転記する際に,研究者は,電子テキスト字体に も注釈を付けたいときがある. 例えば,構造付きの分析的な注釈を,本文中の特定の句に付加して, 当該テキストのテーマやトピックを特定するような場合である. この様な場合には,空要素spanを使うことができる. この要素は,分析モジュールが導入されたときに使うことができる (17.3 部分と解釈を参照).
3.8.2 索引TEI: 索引¶
学術テキストの索引を作る作業には,多くの判断や分析が求められ る技能が必要となる. 従って,この作業に,情報検索向けのソフトウェアを使うという単 純なことはできない. そのようなソフトは,テキストを探すぐらいの,補完的な役割しか 果たせない. 索引の役割とは,キーワードとなる語句が,ある場所へのアクセス を提供するもので,その索引語は,案内されたテキスト中に必ずし も存在する必要はない. この索引を作る作業には,技能が求められる.
- » 3.8.2.2 自動生成の索引
- Home | 目次
3.8.2.1 既存の索引TEI: 既存の索引¶
<!--...-->
<list type="index">
<item>Women, how cause of mel. <ref>193</ref>; their vanity in
apparell taxed, <ref>527</ref>; their counterfeit tears
<ref>547</ref>; their vices <ref>601</ref>, commended,
<ref>624</ref>.</item>
<item>Wormwood, good against mel. <ref>443</ref>
</item>
<item>World taxed, <ref>181</ref>
</item>
<item>Writers of the cure of mel. 295</item>
<!--...-->
</list>
</div>
<list>
<item>how cause of mel. <ref>193</ref>;</item>
<item>their vanity in apparell taxed, <ref>527</ref>;</item>
<item>their counterfeit tears <ref>547</ref>;</item>
<item>their vices
<list>
<item>
<ref>601</ref>,</item>
<item> commended, <ref>624</ref>.</item>
</list>
</item>
</list>
</item>
<!-- in the text --><pb xml:id="P624"/>
<!-- start of page 624 -->
<!-- in the index -->
<ref target="#P624">624</ref>
- « 3.8.2.1 既存の索引
- Home | 目次
3.8.2.2 自動生成の索引TEI: 自動生成の索引¶
機械可読テキストから,自動的に,新たな索引を作ることができれ ば,それがここまでに解説された要素により既に符号化されてりた り,他の資料から既に転記されていた場合であっても,やはり便利である. 当該テキストの複雑さやそのテーマにも依るが,索引を自動的に作 ることは,研究者の要望全てに応えるものではない. けれども,このような機能は,索引を作る専門家が,詳細な索引を 作る際,例えば,編集後のテキストからさらに索引を付加したり, 既存の索引索引を保持しながらの符号化を進める作業を,助けてく れる.
- index 索引項目化されるものの場所を示す.
<index>
<term>Lemmatization, Arabic</term>
</index>and are beginning to build parsers.</p>
これにより,‘Lemmatization’の索引項目が,要素indexが本来 ある場所に作られることになる. The effect of this will be to generate an index entry for the term‘Lemmatization’,referencing the location of the original index element.
topic of Arabic lemmatisation
<index spanTo="#ALAMEND">
<term>Lemmatization, Arabic</term>
</index> concerning which it is important to note .....
<!-- much learned material omitted here -->
and now we can build our parser.<anchor xml:id="ALAMEND"/>
</p>
これにより,先の例と同様の索引項目を生成することができる. 但し,この参照は,ある一点ではなく,要素indexの場所 から「ALAMEND」で示された場所までの 範囲を示している. 従って(例えば,この間にある)一連のページ番号も含むことになる.
本文中にある要素indexの場所は,自動的に索引を作る際の, 参照場所を示しているが,当該要素のテキスト内容自体は,索引項目を作 るためには使われない. 索引項目としてある用語は,要素termの要素内容とは無関係に,単独に記録される. 従って,この要素内容は,必要なだけ繰り返されることになる. これを逐次的にする必要はない. (上例のように)綴りを正規化する範囲を指定したり,所望する形式に よる索引を作る助けとなる何らかの修正を施す範囲を指定すればよい.
<index>
<term sortKey="0000">@</term>
</index>
precedes an attribute name</p>
<!-- definition of the glyph here -->
</char>
<p>The Artist formerly known as Prince <index>
<term sortKey="Prince">
<g ref="#PrinceGlyph"/>
</term>
</index>...</p>
<index indexName="INDEX-PERSONS">
<term>Ashford, John</term>
</index>
was, coincidentally, born in
<index indexName="INDEX-PLACES">
<term>Ashford
(Kent)</term>
</index>Ashford...</p>
<index>
<term>lemmatization</term>
<index>
<term>arabic</term>
</index>
</index>
...</p>
<term>Women</term>
<index>
<term>how cause of mel.</term>
</index>
</index>
<term>Women</term>
<index>
<term>their vices</term>
</index>
</index>
<term>Women</term>
<index>
<term>their vices</term>
<index>
<term>commended</term>
</index>
</index>
</index>
これらの要素indexを処理する際には,構造を明確に するために繰り返し書かれているものは,一般には,まとめられ,最 終的には,先に紹介したような索引項目(訳注: 3.8.2.1 既存の索引に ある例)が出来上がる. けれども,本ガイドラインでは,これを推奨するものではない.
<div type="appendix">
<head>参考文献</head>
<listBibl>
<bibl> ... </bibl>
</listBibl>
</div>
<divGen n="Index Nominum" type="INDEX-NAMES"/>
<divGen n="Index Loci" type="INDEX-PLACES"/>
</back>
<divGen n="A1" type="INDEX-NAMES">
<head>An Index of Names</head>
</divGen>
</back>
PIが使われる場合には,生成される索引の為のパラメータは,別の方 法で示すことができる.
印刷物においては,人手により作られた索引で,ここで紹介するよ うな符号化,つまり,相互参照というものは,不可能である. 例えば,テキスト中にある「TEI」への参照を全て,索引「Text Encoding Initiative」にまとめた場合,「Text Encoding Initiativeを 参照」とあるテキストも,該当箇所として扱う方が便利である. この様な内部相互参照は,索引を自動生成した後の編集で,記録する必 要がある.
- « 3.8 注釈と索引
- » 3.10 参照システム
- Home | 目次
3.9 図等の非テキスト内容TEI: 図等の非テキスト内容¶
図やグラフなどの絵的なものは,各種テキストの中で,様々な用途で使われている. ある時は,テキストの一部としてある(例えば,漫画などでは,テキス ト自体が絵的である). またある時は,選択的なテキストとしてある. また,その絵的なものがなければ,テキストが理解できない場合も ある. 逆に,その絵的なものが,作品の理解に影響しないこともある. 従って,テキスト中にある絵的なものをどのように符号化するかと いう方針は,重要である. 「生来デジタル」の文書であれば,絵的なものや,非テキストの部 分は,何もなくとも,電子化することができるかもしれないが,文 書館に収録されている文書の場合には,編集方針が必要となる.
- figure 図表を示すまたは含む要素をまとめる.
- graphic/ テキスト列中にある図,絵,図表の場所を示す.
- binaryObject 行中の画像やその他のオブジェクトを示す,符号化されたバイナリデータを 示す.
- 非XML形式,例えば,PNGやJPEGといったバイナリ形式.
- XML形式.例えば,SVG.
- TEI形式.例えば,19 グラフ,ネットワーク,木で紹介する, 木やグラフ向けの表記方法.
- att.internetMedia
標準的な用語による計算機資源の種類を表す属性を示す.
mimeType 当該データのMIMEタイプ.
through my first, second, third, and
fourth volumes. -- In the fifth volume
I have been very good, -- the precise
line I have described in it being this :
<graphic url="zigzag2.png" mimeType="image/png"/>
By which it appears, that except at the
curve, marked A. where I took a trip
to Navarre, -- and the indented curve B.
which is the short airing when I was
there with the Lady Baussiere and her
page, -- I have not taken the least frisk
...</p>
<graphic
url="http://www.iath.virginia.edu/gants/Ornaments/Heads/hp-ral02.gif"/>
</head>
14.3 画像データ向けの要素にある要素figureに より,また別の記録の仕方がある. 例えば,複数の画像を,階層構造または束として扱うことができる. また,画像と一緒に,見出しや解説といった付加的な情報も記録する ことができる.
3.10 参照システムTEI: 参照システム¶
「参照システム」とは,名前,すなわち参照が,テキストにある特 定の一節を関連づける仕組みである (例えば,Ps. 23:3とい う参照で,Psalm 23にある3行目を,Amores2.10.7という参照で,2番目の本 の,10番目の詩の,7行目を関連づける). この様な名前を使い,テキスト中にある場所を示すことが可能で, これにより,利用者はその場所を見いだすことができる. 参照システムは,構造上の単位(例えば,章,段落,分,連,詩)や, 印字上の単位(例えば,ページや行番号),参照のために作られた区 分(例えば,書誌情報中の段落や行)を基本単位に,作られている. あるテキストがあるとして,それを電子化する際には,そこにある 印刷による参照システムが,電子版による参照システムと,簡単に 比べることができるような場合にだけ,元の参照システムを電子化 すべきである.
- 参照システムが既に存在し,それが,符号化する際に使われる 論理構造と同じものを元にしている場合には,グローバル属性 xml:idまたはnを使い,当該一節を参照することができ る. または,複数のレベルにある要素にある属性値をまとめて,示 すことも可能である. この詳細は,3.10.1 属性xml:idと属性nにある.
- 既存の参照システムがない場合には,グローバル属性xml:idまたはnを使い,それを構築することができる (例えば,電子形式のコレクションやコーパス). この詳細は,3.10.2 オリジナルの参照システムにある.
- 符号化する際に使われる論理構造とは異なる単位を元にする, 既存の参照システムがある場合(例えば,構造的な区分ではな く,特定の版のページや行を単位とベースとしたもの),参照 システムを作る論理構造の単位は,様々であり得る. この詳細は,20 非階層構造にある.
- 特定の論理構造に依存しない,または論理構造は利用しない, 既存の参照システムがある場合,そのような参照システムは, 要素milestoneを使 い,符号化することができる. この要素は,参照システムで場所が変わるところを示すもので ある. 詳細は,3.10.3 標石要素にある.
既存の参照システムがない場合,当ガイドラインでは,最低限とし て,元テキストにあるページ区切は,本節で解説される方法で, 記録することを推奨している. ページ区切を符号化することは,詳細な参照システムを持ったテキ ストにおいても,推奨されることである. 散文では,行区切りも,必要ではないかもしれないが,符号化する ことができる. 13
3.10.1 属性xml:idと属性nTEI: 属性xml:idと属性n¶
既存の参照システムが,階層的なテキスト構造を使い,それがマー クアップ上でも反映されている場合には,属性nを使い,各構造上の単位に,従来型の識別 子を付与することができる. 属性nは,その他にも,元テキストに あるリスト項目や節の番号を,それが重要と判断されるとき,例 えば,連番にはなっていない時に,それを記録することができる.
<div2 n="1" type="book">
<!-- ... -->
</div2>
<div2 n="2" type="book">
<div3 n="1" type="poem">
<!-- ... -->
</div3>
<div3 n="2" type="poem">
<!-- ... -->
</div3>
<!-- ... -->
<div3 n="10" type="poem">
<l n="1"> ... </l>
<l n="2"> ... </l>
<!-- ... -->
<l n="7"> ... </l>
</div3>
<!-- ... -->
</div2>
<!-- ... -->
</div1>
<div2 n="Amores 1" type="book">
<!-- ... -->
</div2>
<div2 n="Amores 2" type="book">
<div3 n="Amores 2.1" type="poem">
<!-- ... -->
</div3>
<!-- ... -->
<div3 n="Amores 2.10" type="poem">
<!-- ... -->
<l n="Amores 2.10.7"> ... </l>
<!-- ... -->
</div3>
<!-- ... -->
</div2>
<!-- ... -->
</div1>
<div2 xml:id="am.1" type="book">
<!-- ... -->
</div2>
<div2 xml:id="am.2" type="book">
<div3 xml:id="am.2.1" type="poem">
<!-- ... -->
</div3>
<!-- ... -->
<div3 xml:id="am.2.10" type="poem">
<!-- ... -->
<l xml:id="am.2.10.7"> ... </l>
<!-- ... -->
</div3>
<!-- ... -->
</div2>
<!-- ... -->
</div1>
この様な標準的な参照システムの使い方を文書化したり,自動処理を 施すには,TEIヘダーの中で,属性nや属 性xml:idに参照値が記録されているのか, どの要素に参照やその被参照地点が記録されているのかを宣言するこ とが望ましい. 参照システムを宣言する例については,3.10.4 参照システム宣言を参照のこと.
属性nを使うことには,制約がある. 版によっては,複数の構造を持つことがあるため,複数の参照システ ムが必要となることがある一方で,属性nでは,1つの標準的な参照シ ステムしか使うことができない,という制約である. 例えば,「Amores」の別の版では,詩 10を,詩9と続くものとして扱っている場合,ある同じ行を「Amores 2.9.31」としてとして指定するこ とになる. この様な2つの参照システムを同時に記録するためには, 20 非階層構造で解説をする各種の手法を使うことができる.
- « 3.10.1 属性xml:idと属性n
- » 3.10.3 標石要素
- Home | 目次
3.10.2 オリジナルの参照システムTEI: Creating New 参照システム¶
テキスト中に標準的な参照システムがない時には,必要であれば, 当該テキストを符号化した結果,電子テキスト中に生まれれる構造 を使い,参照システムを導入することができる. 長期利用に耐える参照システムで求められるように,参照は,定着し た,変更されない場所であることが,重要になってくる. 当該テキストが,修正・変更されたた場合においても,参照システ ムで使われる,テキストの任意の部分を示す識別子は,同じ部分と 関連し続ける必要がある. これは,参照番号が連番でなくなった場合でも,そうである( 参照としてあった連番が使い物にならなくなっている場合,新し い参照システムは,既存のシステムとは別に作られることになる).
グローバル属性nとxml:idは,参照識別子をテキスト中の区分に 付与するために使われる. これらの属性に付与される識別子は,それが付加される要素全体に 対応するものとなる. ID型の属性は,同一文書中で,必ずユニークな値である. また,その値は,文字から始まる必要がある. このような制約は,属性nの値には課せ られていない.
属性xml:idや属性nに,文書構造上,ユニークな値を自動的に付 与する便利な方法として,「ドメイン型のアドレス」すなわち,構 造上の各階層を代表する構成要素を,ピリオドでつなぐ表記法がある. この方法には,2つのスタイルがある. ひとつは「有型パス」と呼ばれるもので,識別子が, 「要素型 - 数字」 という構造になっているものである. この要素名では,要素の型を特定し,その要素型において選択され る要素を数字で特定する(ハイフンと数字は,同型の要素がひとつ しか内場合には省略できる). もうひとつは「無型パス」はと呼ばれるもので,識別子は, 数字から構成されている. 各数字は,各階層レベルにあるノード列中の要素を特定している.
これら2つの方法で示された識別子において,その開始点は,要素 TEIや要素bodyではなく,要素textとすべ きである. 一般的な例ではないけれども,要素teiHeader向けに識別子が必要な場合, 要素TEIを開始点とすることも可能である. 要素body を根要素のように見なすと,前付けや後付に識別子を付与する必要 はなくなる. 根要素に対応する構成要素には,混乱が生じない限り,識別子は付 与しなくともよい. コレクションやコーパスでは,テキストや資料に付与されるユニー クな識別子が,根要素に対応する構成要素に付与されることになる だろう.
<front xml:id="Front" n="AB.1">
<div xml:id="Front.div-1" n="AB.1.1">
<p> ... </p>
</div>
<titlePage xml:id="Front.titlePage" n="AB.1.2">
<titlePart> ... </titlePart>
</titlePage>
<div xml:id="Front.div-2" n="AB.1.3">
<p> ... </p>
</div>
</front>
<body xml:id="Body" n="AB.2">
<p xml:id="Body.p-1" n="AB.2.1"> ... </p>
<p xml:id="Body.p-2" n="AB.2.2"> ... </p>
<div xml:id="Body.div-1" n="AB.2.3">
<head xml:id="Body.div-1.head" n="AB.2.3.1"> ... </head>
<p xml:id="Body.div-1.p-1" n="AB.2.3.2"> ... </p>
<p xml:id="Body.div-1.p-2" n="AB.2.3.3"> ... </p>
</div>
<div xml:id="Body.div-2" n="AB.2.4">
<head xml:id="Body.div-2.head" n="AB.2.4.1"> ... </head>
<p xml:id="Body.div-2.p-1" n="AB.2.4.2"> ... </p>
<p xml:id="Body.div-2.p-2" n="AB.2.4.3"> ... </p>
</div>
</body>
</text>
属性xml:idに,新たに作られた参照識別 子が記録されている場合には,絶対パスを記録すべきである. 属性nを使う場合には,絶対パスまたは, 当該要素の親要素から示すパスを記録することができる. 標準的な参照識別子の構成方法,それを持つ要素や,識別子となる属 性値は,2.3.5 参照システム宣言で解説するように,ヘダー中で宣言すべ きである.
3.10.3 標石要素TEI: MilestoneElements¶
- milestone/ 当該セクションが,構造要素により表現することができない場合に,標準的 な参照機能により,テキストの各種セクション間にある境界点を示す.
- pb/ テキストのページ境界を,標準的な参照システムにより示す.
- lb/ ある版における新しい(印刷上の)行の始まりを示す.
- cb/ テキストの段と段の境界を,標準的な参照システムにより示す.
これらの要素は,参照システム上のある分類点が,テキスト中で変 化する場所を記録するためのものである. これらの要素は,要素内容を持たないが,当該テキストを分割する, あるいは,道端にある標石のように,区分に分ける働きをする. 要素pb,要素cb, 要素lbは,標石要素の中でも, 特別な型を持つ要素で,それぞれ,ページ,カラム,行の境界を示 すものになる. これらの要素に付くグローバル属性nは, 当該標石要素と関連する特定の単位物を示すものである. 要素milestoneは,構造を構成 するものではないことから,参照システムを検証する際,XMLパー サはこれを解析することができない. 従って,これらの要素は,符号化する人またはソフトウェアの責任 において,適切な順番で記述されていることが保証されるものとな る.
<body>
<milestone unit="part" n="1"/>
<div1 n="1" type="chapter">
<p>
<!-- ... -->
</p>
</div1>
<div1 n="2" type="chapter">
<p>
<!-- ... -->
</p>
</div1>
<div1 n="3" type="chapter">
<p>
<!-- ... -->
</p>
<milestone unit="part" n="2"/>
<p>
<!-- ... -->
</p>
</div1>
</body>
</text>
<body>
<div1 n="1" type="part">
<milestone unit="chapter" n="1"/>
<p>
<!-- ... -->
</p>
<milestone unit="chapter" n="2"/>
<p>
<!-- ... -->
</p>
<milestone unit="chapter" n="3"/>
<p>
<!-- ... -->
</p>
</div1>
<div1 n="2" type="part">
<p>
<!-- ... -->
</p>
<milestone unit="chapter" n="4"/>
<p>
<!-- ... -->
</p>
</div1>
</body>
</text>
標石要素は,同じ作品の異なる版を記録するためにも使うことがで きる. 属性edで版の種類を明示していない要 素を全て無視しても,参照システムを構成することは可能である.
<milestone ed="E2" unit="work"/>
<milestone ed="E1" unit="book"/>
<milestone ed="E1" unit="poem"/>
<milestone ed="E2" unit="poem"/>
<milestone ed="E2" unit="book"/>
<milestone ed="E1" unit="poem"/>
<milestone ed="E2" unit="poem"/>
この例では,属性nは使われていない. 理由は,数値は連番をなしており,従って,必要であれば再構築する ことが可能だからである.
<milestone ed="E1" unit="book" n="1"/>
<milestone ed="E1" unit="poem" n="1"/>
<milestone ed="E1" unit="poem" n="2"/>
<milestone ed="E1" unit="book" n="2"/>
<milestone ed="E1" unit="book" n="1"/>
<milestone ed="E1" unit="poem" n="1.1"/>
<milestone ed="E1" unit="poem" n="1.2"/>
<milestone ed="E1" unit="book" n="2"/>
要素milestoneを使い,行番 号を各行毎または周期的(5行毎,10行毎など)に記録することができる. 周期的な記録は簡単である. 各行毎の記録は,より堅固である.
属性nの値で採用される付番の方法につい て,制約はない. 例えば,先の例においても, 属性値をI.i,I.ii,I.iiiとして も同じ事である. 但し,「unnumbered」は特別な値として 予約されている. これは,通常の付番方法とは異なる(例えば,章の見出し,詩の番号, タイトル,韻文劇における話者の帰属など)場合に使うべき値となる.
属性edの値には,原則,制約はない. 属性値に何らかの制約を課した方がよいと判断された時には, 23.2 Personalization and Customizationで解説さ れる手法を使うことができる. 例えば,規定値から選択したものを属性値に使う場合などである.
例えば,以下にある3.10.4 参照システム宣言 では,参照システムの宣言の仕方が解説されている.
3.10.4 参照システム宣言TEI: Declaring 参照システム¶
どのような参照システムを使うにせよ,それは 2.3.5 参照システム宣言で解説したように, TEIヘダー内にある要素refsDeclに記録されることが望ましい. 参照システムは,要素cRefPatternを使い,形式的に宣言する か,または,非形式的に散文で記録される. 前者の方法が推奨される. 理由は,散文による解説とは異なり,処理が可能になるからである.
<fileDesc>
<!--... -->
</fileDesc>
<encodingDesc>
<refsDecl>
<cRefPattern
matchPattern="([^ ]+)([0-9]+)\.([0-9]+)\.([0-9]+)"
replacementPattern="#xpath(//div1[@n='$1']/div2[@n='$2']/div3[@n='$3']/l[@n='$4']">
<p>A canonical reference is assembled with
<list>
<item>the name of the <label>work</label>: the
<att>n</att> of a <gi>div1</gi>,</item>
<item>a space,</item>
<item>the number of the <label>book</label>: the
<att>n</att> of a child <gi>div2</gi>,</item>
<item>a full stop</item>
<item>the number of the <label>poem</label>: the
<att>n</att> of a child <gi>div3</gi>,</item>
<item>the line number: the <att>n</att> value of a
child <gi>l</gi>
</item>
</list>
</p>
</cRefPattern>
<cRefPattern
matchPattern="([^ ]+)([0-9]+)\.([0-9]+)"
replacementPattern="#xpath(//div1[@n='$1']/div2[@n='$2']/div3[@n='$3']">
<p>Same as above, but without the last component (full
stop followed by the <gi>l</gi>'s <att>n</att>.</p>
</cRefPattern>
<cRefPattern
matchPattern="([^ ]+) ([0-9]+)"
replacementPattern="#xpath(//div1[@n='$1']/div2[@n='$2']">
<p>Same as above, but without the poem component (full
stop followed by the <gi>div3</gi>'s <att>n</att>.</p>
</cRefPattern>
</refsDecl>
</encodingDesc>
</teiHeader>
<cRefPattern
matchPattern="([^ ]+[0-9]+\.[0-9]+\.[0-9]+)"
replacementPattern="#xpath(//l[@n='$1')"/>
</refsDecl>
<cRefPattern
matchPattern="([^ ]+[0-9]+\.[0-9]+\.[0-9]+)"
replacementPattern="#xpath(//l[@n='$1')"/>
<cRefPattern
matchPattern="([^ ]+[0-9]+\.[0-9]+)"
replacementPattern="#xpath(//div2[@n='$1')"/>
</refsDecl>
<cRefPattern matchPattern="(.*)" replacementPattern="#$1"/>
</refsDecl>
<p>Standard references to work, book, poem, and line may be
constructed from the milestone tags in the text.</p>
</refsDecl>
<refState ed="E1" unit="work" delim=" "/>
<refState ed="E1" unit="book" delim="."/>
<refState ed="E1" unit="poem" delim=":"/>
<refState ed="E1" unit="line"/>
</refsDecl>
- « 3.10 参照システム
- » 3.12 韻文・舞台芸術中の一節
- Home | 目次
3.11 書誌項目の記述または参照TEI: 書誌項目の記述または参照¶
- bibl 厳密でない構造を持つ書誌情報の引用を含む.下位要素で明示 されていたり, いなかったりする.
- biblStruct 構造を持った書誌情報を示す.下位要素として,書誌情報を示 す要素が決められた順番で出現する.
- biblFull 厳密な構造を持つ書誌情報を示す.TEIのファイル記述の全要素は,ここに記述される.
- listBibl 書誌項目引用のリストを示す.
印刷物では,書誌情報を構成する個々の項目は,伝統的に,それぞ れ独立して示され,本文の流れとは別のものとして,例えば,括弧 で括られたり,斜体で示されたり,特別な句点で示されたり,下線 を引かれたりしている. 電子物においても,この種の区別は,すなわち,ある特別な言語的 特性を持つテキストオブジェクトとして,参照が区別できることは, 出力を整形する際にも,検索をする際にも,重要なものとなる. 14
他のテキスト素性と同じく,参照にとって一番の関心事は,当該テ キストの印刷時にどのような書式を採るかではないことを,強調し ておく. 本節で解説するスキームが想定する区分は,多くの一般的なソフト ウェアで十分なものであるべきものであったとしても,必ずしも全 てのフォーマッタや,参照スタイルが求めるものではないかもしれない. 15 以下で解説する素性(詳細は3.11.2 書誌参照の構成要素)は,多くの書誌情 報やソフトウェアで有効なもので,また,既存の書誌情報や多く の図書目録にも対応している. 電子テキストへの対応についての詳細は,2.2.7 元資料解説を参照のこと. 図書目録についての簡単な解説は,2.7 書誌情報に関する注釈にある.
- » 3.11.2 書誌参照の構成要素
- Home | 目次
3.11.1 書誌参照TEI: 書誌参照¶
クラスmodel.biblLikeのメンバーは,多くの下位要素を持つこ とになる. 例えば,要素biblや要素biblStructは,同じ下位要素をとることが可能 で,その詳細は3.11.2 書誌参照の構成要素にある. また,要素biblFullは,下位要素として, 2.2 ファイル解説で示した要素をとる.
was <bibl>Tufte's <title>Envisioning Information</title>
</bibl>, although he may
never have actually read it.</p>
was Tufte's <title>Envisioning Information</title>,
although he may never have actually read it.</p>
in <bibl>Baxter, 1983</bibl>.
<monogr>
<author>Edward R. Tufte</author>
<title>Envisioning Information</title>
<imprint>
<pubPlace>Cheshire, Conn.</pubPlace>
<publisher>Graphics Press</publisher>
<date>1990</date>
</imprint>
</monogr>
</biblStruct>
<titleStmt>
<title>Envisioning Information</title>
<author>Tufte, Edward R[olf]</author>
</titleStmt>
<extent>126 pp.</extent>
<publicationStmt>
<publisher>Graphics Press</publisher>
<pubPlace>Cheshire, Conn. USA</pubPlace>
<date>1990</date>
</publicationStmt>
</biblFull>
<head>参考文献</head>
<biblStruct xml:id="NELSON80">
<analytic>
<author>Nelson, T. H.</author>
<title>Replacing the printed word:
a complete literary system.</title>
</analytic>
<monogr>
<title>Information Processing '80: Proceedings of the IFIPS
Congress, October 1980</title>
<editor>Simon H. Lavington</editor>
<imprint>
<publisher>North-Holland</publisher>
<pubPlace>Amsterdam</pubPlace>
<date>1980</date>
</imprint>
<biblScope>pp 1013–23 </biblScope>
</monogr>
<note>Apparently a draft of section 4 of
<title>Literary Machines</title>.</note>
</biblStruct>
<bibl xml:id="NELSON88">Ted Nelson: <title>Literary Machines</title>
(privately published, 1987)</bibl>
<bibl xml:id="BAXTER88">
<author>Baxter, Glen</author>
<title>Glen Baxter His Life: the years of struggle</title>
London: Thames and Hudson, 1988.
</bibl>
</listBibl>
<head>参考文献</head>
<item>
<bibl xml:id="NEL80">
<author>Nelson, T. H.</author>
<title level="a">Replacing the printed word:
a complete literary system.</title>
<title level="m">Information Processing '80:
Proceedings of the IFIPS Congress, October 1980</title>
<editor>Simon H. Lavington</editor>
<publisher>North-Holland</publisher>
<pubPlace>Amsterdam</pubPlace>
<date>1980</date>
<biblScope>pp 1013–23
</biblScope>
<note>Apparently a draft of section 4 of
<title>Literary Machines</title>.</note>
</bibl>
</item>
<item>
<bibl xml:id="NEL88">Ted Nelson: <title>Literary Machines</title>
(privately published, 1987)</bibl>
</item>
<item>
<bibl xml:id="BAX88">
<author>Baxter, Glen</author>
<title>Glen Baxter His Life: the years of struggle</title>
London: Thames and Hudson, 1988.
</bibl>
</item>
</list>
- « 3.11.1 書誌参照
- » 3.11.3 書誌ポインタ
- Home | 目次
3.11.2 書誌参照の構成要素TEI: 書誌参照の構成要素¶
- 「収録」「単刊」「シリーズ」レベル毎の構成要素.
- 各種のタイトルや知的責任表示(作者など)
- 出版,ページ立てなどに関する情報(多くはクラスmodel.biblPartのメン バー)
- 注釈,コメント,詳説など.
3.11.2.1 収録,単刊,シ リーズTEI: Analytic, Monographic, and Series Levels¶
- 収録(された作品)レベル
- 単刊レベルでのタイトル,版,編集者など.
- シリーズレベルの,タイトル,編集者,巻・号など.
TEIでは,雑誌や作品集は,単刊物として扱う. 従って,雑誌にはタイトルがあり,それは要素 title level="j"または要素 monogrの中で要素 title を使い記録される. 雑誌やテキストのコレクションにある個々の作品は,分析的レベ ルで記録すべきである. 複数の雑誌またはコレクションに同じ作品が掲載された場合に は,複数の要素monogrと,それに続く複数の要素series を使い,記録することができる. 要素seriesは,常に,直近の要素 monogrと関連することになる (再版された作品に,統一した1つの書誌情報を付与するか,それ ぞれに書誌情報を付与するかは,スタイルの違いである. この場合,図書館では,個別に書誌情報を与えているが,学術論 文などでは,単一のものとして扱うのが普通である.)
<analytic>
<author>Thaller, Manfred</author>
<title level="a">A Draft Proposal for a Standard for the
Coding of Machine Readable Sources</title>
</analytic>
<monogr>
<title level="j">Historical Social Research</title>
<imprint>
<biblScope type="vol">40</biblScope>
<date>October 1986</date>
<biblScope type="pages">3-46</biblScope>
</imprint>
</monogr>
<monogr>
<title level="m">Modelling Historical Data:
Towards a Standard for Encoding and
Exchanging Machine-Readable Texts</title>
<editor>Daniel I. Greenstein</editor>
<imprint>
<pubPlace>St. Katharinen</pubPlace>
<publisher>Max-Planck-Institut für Geschichte
In Kommission bei
Scripta Mercaturae Verlag</publisher>
<date>1991</date>
</imprint>
</monogr>
<series xml:lang="de">
<title level="s">Halbgraue Reihe
zur Historischen Fachinformatik</title>
<respStmt>
<resp>Herausgegeben von</resp>
<name type="person">Manfred Thaller</name>
<name type="org">Max-Planck-Institut für Geschichte</name>
</respStmt>
<title level="s">Serie A: Historische Quellenkunden</title>
<biblScope>Band 11</biblScope>
</series>
</biblStruct>
収録レベルと単刊レベルでの記録は,ひとつの引用中に収めるか, 別の作品中に収めるかで区別されるべきである. これは,符号化する人が,ある種の基準で,判断することになる. 詳細は,3.11.2.5 関連項目を参照のこと.
構造化された書誌項目の間に句点は入力されるべきではない. 但し,要素を区切る働きを持つものは例外である. 先の例にあるように,要素と要素の間に句点を含まず,書誌項目を記録 することは可能である. これは,要素biblStructを使うことで,可能となる. これにより,様々なスタイルの書誌参照を記録することができる.
3.11.2.2 著者,タイトル,編集者TEI: Authors, Titles, and Editors¶
- title 作品の完全なタイトルを示す.
- author 書誌情報における,著作者(個人・団体)の名前を示す.書誌項 目における責任者を示す第一位の記述を示す.
- editor 書誌情報における,第二位の責任者を示す.個人,団体,組織, 編集者,編纂者,翻訳者の名前など.
- respStmt 著者や編集者など特定の役割を示す要素が充分ではない場合 に,テキスト,版,記録などの知的内容に関する責任を示す.
- resp 人物の知的責任の性質を表す一節を示す.
- name 固有名詞.
- meeting 会議中の項目を書誌情報で記述する際や,発行物の見出しや序 文に現れる,会合や会議を表す,形式化された記述的タイトルを示す.
<analytic>
<author>Lucy Allen Paton</author>
<title>Notes on Manuscripts of the
<title level="m" xml:lang="fr">Prophécies de Merlin</title>
</title>
</analytic>
<monogr>
<title level="j">PMLA</title>
<imprint>
<biblScope type="vol">8</biblScope>
<date>1913</date>
<biblScope type="pages">122</biblScope>
</imprint>
</monogr>
</biblStruct>
書誌情報を扱うソフトによっては,メインタイトルと,下位のタイト ルや別タイトルを分けた方がよい場合もある. この様な場合,属性typeを使い,それを 区別することができる.
<title level="a" type="main">Studies on the physiology of
the hibernating hedgehog, 15</title>
<title level="a" type="subordinate">Effects of seasonal
and temperature changes on the in vitro glycerol release from
brown adipose tissue</title>
<title level="j">Ann. Acad. Sci. Fenn., Ser. A4</title>
<date>1972</date>
<biblScope type="vol">187</biblScope>
<biblScope type="pp">1-4</biblScope>
</bibl>
<title level="m" type="main">The swan lake ballet</title>
= <title level="m" type="parallel" xml:lang="fr">Le lac des cygnes</title>
: <title level="m" type="subordinate" xml:lang="fr">grand ballet en 4 actes</title>
: <title level="m" type="subordinate">op. 20</title>
[Score].
New York: Broude Brothers; [1951] (B.B. 59). vi, 685 p.</bibl>
印刷された書籍や論文にとって, 要素authorや要素editorは,重要である. これに比べれば,他の書誌項目の重要性は,落ちるかもしれない. 要素authorは,当該作品の知的内容に責任を持つ 人物または団体を記録するために使われるべきである. 要素editorは,当該作品の編集者を記 録するために使われるべきである. 例えば,ラジオ局やテレビ局のような団体も,通常は「著者」と見な される. また,国家が発行する報告書の「著者」には,通常は,それを制作し た部局が該当する.
当該作品に何らかの責任を持つ人物は,要素respStmt に記録されるべきである. この時,責任の性質は,要素respに記録され,人物・団体などは,要素 nameまたは persNameまたはorgNameに記録される. 要素rsは,文 字列「unknown」をとることがある. 要素respStmtの中には, 4つの要素name,persName,orgName,rsのうちから少なくとも1つの要素と,1 つの要素respをとるべきで,これに続けて選択的 に要素をとることができる.
2次的な責任者の例としては,イラストレータ,翻訳者,符号化する 人,注釈を記入する人などがある. 要素respStmtは,編集者について,その役割など を特定の用語で記録したい時に,使うことができる.
要素authorと要素editorの使用例は,3.11.1 書誌参照や, 3.11.2.1 収録,単刊,シリーズにある. 要素authorや要素editorが使われるときには,要素 respStmtも使うことができる. これらのうち1つの要素がタイトルに先行して記録されている場合に は,当該要素は,このタイトルに関する記録となる. また,これらのうち1つの要素に続いて,要素editionが 記録されていたり,これらが版ステートメントの中で使われている場 合には,その版に関する記録となる.
<author>Lominadze, D. G.</author>
<title level="m">Cyclotron waves in plasma.</title>
<respStmt>
<resp>translated by</resp>
<name>A. N. Dellis;</name>
</respStmt>
<respStmt>
<resp>edited by</resp>
<name>S. M. Hamberger.</name>
</respStmt>
<edition>1st ed.</edition>
<pubPlace>Oxford:</pubPlace>
<publisher>Pergamon Press,</publisher>
<date>1981.</date>
<extent>206 p.</extent>
<title level="s">International series in natural philosophy.</title>
<note place="inline">Translation of:
<title xml:lang="ru" level="m">Ciklotronnye volny v plazme.</title>
</note>
</bibl>
<monogr xml:lang="de">
<title>Des Minnesangs Frühling</title>
<note place="inline">Mit 1 Faksimile</note>
<edition>36., neugestaltete und erweiterte Auflage</edition>
<respStmt>
<resp>Unter Benutzung der Ausgaben von <name>Karl
Lachmann</name> und <name>Moriz Haupt</name>, <name>Friedrich
Vogt</name> und <name>Carl von Kraus</name> bearbeitet von</resp>
<name>Hugo Moser</name>
<name>Helmut Tervooren</name>
</respStmt>
<imprint>
<biblScope type="volume">I Texte</biblScope>
<pubPlace>Stuttgart</pubPlace>
<publisher>S. Hirzel Verlag</publisher>
<date>1977</date>
</imprint>
</monogr>
</biblStruct>
<monogr>
<title>Proceedings of a workshop on corpus resources</title>
<respStmt>
<resp>Programme Organizer</resp>
<name>Geoffrey Leech</name>
</respStmt>
<meeting>DTI Speech and Language Technology Club meeting, 3-4
January 1990, Wadham College, Oxford</meeting>
</monogr>
</biblStruct>
3.11.2.3 刊記やページなどTEI: Imprint, Pagination, and Other Details¶
- imprint 書誌情報の対象となるものの,出版に関する情報を示す.
- address 郵便配達情報を示す.例えば,出版者,組織,個人の住所など.
- pubPlace 書誌項目が出版された場所の名前を示す.
- publisher 書誌項目の出版や頒布に責任のある団体の名前を示す.
- date 日付を示す.
- idno 書誌項目を特定する標準的・非標準的数値を示す.
- extent 電子・非電子テキストのおよその大きさを任意の単位で示す.
- biblScope 書誌情報の参照範囲を示す.例えば,ページ番号,下部単位の名前など.
一般には,書誌情報では出版地が必要で,詳細な住所ではなく,地 域の名前が記録される. この種の情報は,要素pubPlaceで記録される. 書誌項目を特定するために,詳細な住所が必要な場合には, 3.5.2 住所 で解説する要素addressで記録することになる. または,3.5.1 参照文字にある, 要素rsや, 要素name で記録することも可能である. この場合,記録される情報は,詳細な住所でも都市名でもよい.
<monogr>
<author>Nicholas, Charles K.</author>
<author>Welsch, Lawrence A.</author>
<title>On the interchangeability of SGML and ODA</title>
<imprint>
<pubPlace>Gaithersburg, MD</pubPlace>
<publisher> National Institute of Standards and Technology
</publisher>
<date when="1992-01">January 1992</date>
</imprint>
<extent>19 pp.</extent>
</monogr>
<idno type="NIST">NISTIR 4681</idno>
</biblStruct>
<monogr>
<author>Hansen, W.</author>
<title level="u">Creation of hierarchic text
with a computer display</title>
<note place="inline">Ph.D. dissertation</note>
<imprint>
<publisher>Dept. of Computer Science, Stanford Univ.</publisher>
<pubPlace>Stanford, CA</pubPlace>
<date when="1971-06">June 1971</date>
</imprint>
</monogr>
</biblStruct>
<monogr>
<author>Shirley, James</author>
<title type="main">The gentlemen of Venice</title>
<title type="subordinate">a tragi-comedie presented at the private
house in Salisbury Court by Her Majesties servants</title>
<note place="inline">[Microform]</note>
<imprint>
<pubPlace>London</pubPlace>
<publisher>H.Moseley</publisher>
<date>1655</date>
</imprint>
<extent>78 p.</extent>
</monogr>
<monogr>
<imprint>
<pubPlace>New York</pubPlace>
<publisher>Readex Microprint</publisher>
<date>1953</date>
</imprint>
<extent>1 microprint card, 23 x 15 cm.</extent>
</monogr>
<series>
<title>Three centuries of drama: English, 1642–1700</title>
</series>
</biblStruct>
上記の例を,別の方法で記録する方法として, 3.11.2.5 関連項目で解説す る要素relatedItemを使う方法もある.
書誌情報の中でも,特に収録タイトルには,所在を特定する付加的な 情報が含まれることがある. 例えば,巻番号,ページ番号,ページの範囲,上位項目から見た下位 番号などである. この様な場合,要素biblScopeを使うことができる. このような付加的な情報(巻番号,ページ番号,章番号など)の分類を 分けるときには,属性typeを使い,任意 の分類が可能である.
書誌項目が,雑誌にある論文中で引用されているものである場合,要 素imprintを使い,要素dateや,巻番 号やページ番号を記録できる要素biblScopeと共に,記録することができる.
<analytic>
<author>Wrigley, E. A.</author>
<title>Parish registers and the historian</title>
</analytic>
<monogr>
<editor>Steel, D. J.</editor>
<title>National index of parish registers</title>
<imprint>
<pubPlace>London</pubPlace>
<publisher>Society of Genealogists</publisher>
<date when="1968">1968</date>
<biblScope type="vol">vol. 1</biblScope>
<biblScope type="pp">pp. 155–167.</biblScope>
</imprint>
</monogr>
</biblStruct>
<analytic>
<author>Boguraev, Branimir</author>
<author>Neff, Mary</author>
<title>Text Representation, Dictionary Structure,
and Lexical Knowledge</title>
</analytic>
<monogr>
<title level="j">Literary & Linguistic Computing</title>
<imprint>
<biblScope type="vol">7</biblScope>
<biblScope type="issue">2</biblScope>
<date>1992</date>
<biblScope type="pp">110-112</biblScope>
</imprint>
</monogr>
</biblStruct>
<analytic>
<author>Chesnutt, David</author>
<title>Historical Editions in the States</title>
</analytic>
<monogr>
<title level="j">Computers and the Humanities</title>
<imprint>
<biblScope>25.6</biblScope>
<date when="1991-12">(December, 1991):</date>
<biblScope>377–380</biblScope>
</imprint>
</monogr>
</biblStruct>
- « 3.11.2.3 刊記やページなど
- » 3.11.2.5 関連項目
- Home | 目次
3.11.2.4 シリーズ情報TEI: シリーズ情報¶
シリーズ情報は,要素seriesStmtを使い, 要素biblの元で(また,要素biblFullの元では必須の情報として) 記録することができる. または,(要素biblFullの元では)要素seriesStmtに記録することができる. シリーズタイトルは,要素title level="s"に,巻番号は,要素biblScope type="vol"に, 当該シリーズの責任情報(例えば, 3.11.2.1 収録,単刊,シリーズにある例 の編集者の名前や所属)などは,要素editorまたは要素respStmtに記録することができ る.
- « 3.11.2.4 シリーズ情報
- » 3.11.2.6 注釈など
- Home | 目次
3.11.2.5 関連項目TEI: 関連項目¶
書誌情報の専門用語としてある「関連項目」とは,当該定義された 書誌項目と関連している対象を示すものである. 先に見た収録項目と単刊項目の違いは,この「関連項目」の特殊な 関係とも考えることができる. しかし,一般には,関連項目としては,例えば,翻訳,続巻,元資 料,断片などが該当する.
- relatedItem 当該内容と関連する書誌情報項目を示す,または参照する. 例えば,構成要素または他の版など.
<monogr>
<author>Swinburne, Algernon Charles</author>
<title>Swinburne's <title>Atalanta in Calydon</title>: A Facsimile of the
First Edition</title>
<editor>Georges Lafourcade</editor>
<imprint>
<pubPlace>London</pubPlace>
<publisher>Oxford UP</publisher>
<date>1930</date>
</imprint>
</monogr>
<relatedItem type="original">
<ref target="#bibl04"/>
</relatedItem>
</biblStruct>
<biblStruct xml:id="bibl04">
<monogr>
<author> Swinburne, Algernon Charles</author>
<title>Atalanta in Calydon</title>
<imprint>
<pubPlace>London</pubPlace>
<publisher>Edward Moxon</publisher>
<date>1865</date>
</imprint>
</monogr>
</biblStruct>
<monogr>
<author>Shirley, James</author>
<title type="main">The gentlemen of Venice</title>
<imprint>
<pubPlace>New York</pubPlace>
<publisher>Readex Microprint</publisher>
<date>1953</date>
</imprint>
<extent>1 microprint card, 23 x 15 cm.</extent>
</monogr>
<series>
<title>Three centuries of drama: English, 1642–1700</title>
</series>
<relatedItem type="original">
<biblStruct>
<monogr>
<author>Shirley, James</author>
<title type="main">The gentlemen of Venice</title>
<title type="subordinate">a tragi-comedie presented at the private
house in Salisbury Court by Her Majesties servants</title>
<imprint>
<pubPlace>London</pubPlace>
<publisher>H. Moseley</publisher>
<date>1655</date>
</imprint>
<extent>78 p.</extent>
</monogr>
</biblStruct>
</relatedItem>
</biblStruct>
- « 3.11.2.5 関連項目
- » 3.11.2.7 書誌項目の順序
- Home | 目次
3.11.2.6 注釈などTEI: 注釈など¶
- note 注釈・コメント.
<author>Coombs, James H., Allen H. Renear,
and Steven J. DeRose.</author>
<title level="a">Markup Systems and the Future of Scholarly
Text Processing.</title>
<title level="j">Communications of the ACM</title>
<biblScope>30.11 (November 1987): 933–947.</biblScope>
<note>Classic polemic supporting descriptive over procedural
markup in scholarly work.</note>
</bibl>
- « 3.11.2.6 注釈など
- Home | 目次
3.11.2.7 書誌項目の順序TEI: 書誌項目の順序¶
要素biblの下位要素には,その出現 順序に制限はない.
- 要素noteには,出版に関する情報が(要素meetingには,論文集の場合,会議に 関する情報)が記録される.
- 要素editionには,関連する要素editorまたは要素respStmtが続く.
- 要素imprint
- 要素biblScope
要素biblStructにある要素seriesの下位要素には,出現順序に制 約はない.
書誌記述に関するより詳細は構造は,要素biblFullに記録されるべきである. これについては,本節では詳細を解説しない. 記録される内容は,要素teiHeader中にある要素fileDescに記録されるものと同等である. この詳細は,2.2 ファイル解説にある.
3.11.3 書誌ポインタ TEI: 書誌ポインタ ¶
- « 3.11.3 書誌ポインタ
- Home | 目次
3.11.4 他の書誌スキームとの関連TEI: 他の書誌スキームとの関連¶
ここで紹介する書誌情報の項目は,多くの書誌情報の記録方式で も,独立したものとされている. 以下にあるリストの項目は,一般的なシステムを利用する場合に有 効で,例えば,主な書誌情報のシステム,Scribeや BibTeX,ProCiteにも対応するものがある.
- address
- 要素city(訳注:原文のまま), place,addressに対応.
- annote
- 要素noteに対応.
- author
- 要素authorに対応.
- booktitle
- 要素title level="m"や, 要素monogr内の要素 titleに対応.
- chapter
- 要素biblScope type="chapter" に対応.
- date
- 書誌データベースに登録された日付を記録するもの.対応す るものはない.
- edition
- 要素editionに対応.
- editor
- 要素editor,respStmtに対応.
- editors
- 複数の要素editor,respStmtに対応.
- fullauthor
- 属性reg(訳注:原文のまま),要 素author,nameに対応.
- fullorganization
- 要素name type="org"の属性 regに対応(訳注:原文のまま).
- howpublished
- 要素noteに対応. note place="inline"のように書 ける.
- institution
- 技術レポートの発行者を記録する. 要素publisherに対応.
- journal
- 要素title level="j"や,要素monogr内の要素titleに対応.
- key
- 書誌項目の並べ替えキーを示す. 著者や編集者の名前に代わるもの. これに対応するものは(TEIには)ない.
- meeting
- 要素meeting,要素noteに対応.
- month
- 要素dateに対応. この要素が,処理可能な書式ではない場合,属性 whenに, XML Schema Part 2: Datatypes Second Edition に準拠した,正規化されたデータが記録される.
- note
- 要素noteに対応する.
- number
- 要素biblScope type="issue", 要素biblScope type="number"に 対応する. 技術報告書の番号には,要素idnotype="docno"が対応する.
- organization
- 会議の後援者を記録するもの. 要素meeting内の要素respStmtの中にある要素name type="org"が対応する.
- pages
- 要素biblScope type="pp"に対応.
- publisher
- 要素publisherに対応.
- school
- 作品が作られた団体を示す. 要素publisherに対応.
- series
- 要素title level="s"や, 要素series内の要素titleに対応.
- title
- 関連する文脈中,または属性levelに適切な値と伴う要素titleに対応.
- volume
- 要素biblScope type="vol"に対 応.
- year
- 要素dateに対応. この日付が,処理可能な書式ではない場合,属性valueに,ISO準拠の値が記録される.
- « 3.11 書誌項目の記述または参照
- » 3.13 コアモジュール
- Home | 目次
3.12 韻文・舞台芸術中の一節TEI: 韻文・舞台芸術中の一節¶
韻文や舞台芸術向けのテキストのそれぞれで使われる要素について は,それぞれ別の章で詳しく解説してある(韻文については 6 韻文を参照のこと.ま た,舞台芸術向けテキストについては, 7 Performance Textsを参照のこと.). 本節では,上記の要素のみを解説する. これらは,散文,韻文,舞台芸術向けテキストのいずれにおいても 使うことができる.
- » 3.12.2 舞台芸術向けコア要素
- Home | 目次
3.12.1 韻文向けコア要素TEI: 韻文向けコア要素¶
韻文におけるテキストや詩は,他のテキストと同様に,階層構造 を作ることができる. 例えば,書籍や編などである. この様な構成要素には, 4 テキスト構造モジュール や6 韻文で解説するよう に,一般用途向けの要素divや,要 素div1 等を使った方がよい. 韻文を構成する基本単位は,段落ではなく,「行」となる.
<l>Of that Forbidden Tree, whose<lb/> mortal tast</l>
<l>Brought Death into the World,<lb/> and all our woe,</l>
<l>With loss of Eden, till one greater Man</l>
<l>Restore us, and regain the blissful Seat...</l>
要素lは,韻 文ではない資料の,印刷上の行を記録するためには,使うべきでは ない. 散文中での改行の場所が,分析上,重要と思われる際には,要素lbに記録されるべきであ る. または,要素segや要素abといった,一般的な区分を示す要素に記 録することもできる. これらの詳細は,16 リンク,分割,統合にある. 要素lは,ク ラスmodel.lLikeのメンバー である. このクラスは,クラスmodel.pLikeと共に, クラスmodel.divPartの下位クラスである.
- att.typed
要素を分類するための属性を示す.
type 当該要素の分類を示す. subtype 必要であれば,当該要素の下位分類を示す.
<l>Come fill up the Glass,</l>
<l rend="indent">Round, round let it pass,</l>
<l>'Till our Reason be lost in our Wine:</l>
<l rend="indent">Leave Conscience's Rules</l>
<l rend="indent">To Women and Fools,</l>
<l>This only can make us divine.</l>
</lg>
<lg n="Chorus" type="refrain">
<l>Then a Mohock, a Mohock I'll be,</l>
<l>No Laws shall restrain</l>
<l>Our Libertine Reign,</l>
<l>We'll riot, drink on, and be free.</l>
</lg>
<lg type="octet">
<l>Thus speaks the Muse, and bends her brow severe:—</l>
<l>“Did I, <name>Lætitia</name>, lend my choicest lays,</l>
<l>And crown thy youthful head with freshest bays,</l>
<l>That all the' expectance of thy full-grown year</l>
<l>Should lie inert and fruitless? O revere</l>
<l>Those sacred gifts whose meed is deathless praise,</l>
<l>Whose potent charms the' enraptured soul can raise</l>
<l>Far from the vapours of this earthly sphere!</l>
</lg>
<lg type="sestet">
<l>Seize, seize the lyre! resume the lofty strain!</l>
<l>'T is time, 't is time! hark how the nations round</l>
<l>With jocund notes of liberty resound,—</l>
<l>And thy own <name>Corsica</name> has burst her chain!</l>
<l>O let the song to <name>Britain's</name> shores rebound,</l>
<l rend="indent(-1)">Where Freedom's once-loved voice is heard,
alas! in vain.”</l>
</lg>
</lg>
<l>More tight at this, then thou: Dispatch. O Loue,</l>
<l>That thou couldst see my Warres to day, and knew'st</l>
<l>The Royall Occupation, thou should'st see</l>
<l part="I">A Workeman in't. <stage>Enter an Armed Soldier.</stage>
</l>
<l part="F">Good morrow to thee, welcome. </l>
<!-- ... -->
<l>Unprofitably travelling toward the grave,</l>
<l>Like a false steward who hath much received</l>
<l part="I">And renders nothing back.</l>
</lg>
<lg type="para" n="7">
<l part="F">Was it for this</l>
<l>That one, the fairest of all rivers, loved</l>
<l>To blend his murmurs with my nurse's song,</l>
<!-- ... -->
</lg>
<speaker>First Voice</speaker>
<lg type="stanza" part="I">
<l>But why drives on that ship so fast</l>
<l>Withouten wave or wind?</l>
</lg>
</sp>
<sp>
<speaker>Second Voice</speaker>
<lg type="stanza" part="F">
<l>The air is cut away before,</l>
<l>And closes from behind.</l>
</lg>
</sp>
行のまとまりを,単純な階層構造とはならない,または非連続的なも のとして結びつける方法については,16 リンク,分割,統合で解説する. 韻文の符号化に関する他の要素や属性については,6 韻文で解説する.
- « 3.12.1 韻文向けコア要素
- Home | 目次
3.12.2 舞台芸術向けコア要素TEI: 舞台芸術向けコア要素¶
他のテキストと同様に,舞台芸術のテキスト,例えば,映画やドラ マの脚本などにも,文書構造がある. 例えば,幕や場などである. この様な構造単位は,4 テキスト構造モジュールや, 7 Performance Textsで解 説する,一般的な区分を示す要素divや要素 div1など を使い,記録すべきである. これらの要素の中で,舞台芸術テキストの本文を構成する「発話」 が記録される. 発話は,その話者を示す句や,時には,各種のト書きが伴うことも ある.
<head>Scene 2.</head>
<stage type="setting">Peachum, Filch.</stage>
<sp>
<speaker>FILCH.</speaker>
<p>Sir, Black Moll hath sent word her Trial comes on in
the Afternoon, and she hopes you will order Matters
so as to bring her off.</p>
</sp>
<sp>
<speaker>PEACHUM.</speaker>
<p>Why, she may plead her Belly at worst; to my
Knowledge she hath taken care of that Security.
But, as the Wench is very active and industrious,
you may satisfy her that I'll soften the Evidence.</p>
</sp>
<sp>
<speaker>FILCH.</speaker>
<p>Tom Gagg, sir, is found guilty.</p>
</sp>
</div2>
<head>ACT I</head>
<div2 n="1" type="Scene">
<head>SCENE I</head>
<stage rend="italic">Enter Barnardo and Francisco,
two Sentinels, at several doors</stage>
<sp>
<speaker>Barn</speaker>
<l part="Y">Who's there?</l>
</sp>
<sp>
<speaker>Fran</speaker>
<l>Nay, answer me. Stand and unfold yourself.</l>
</sp>
<sp>
<speaker>Barn</speaker>
<l part="I">Long live the King!</l>
</sp>
<sp>
<speaker>Fran</speaker>
<l part="M">Barnardo?</l>
</sp>
<sp>
<speaker>Barn</speaker>
<l part="F">He.</l>
</sp>
<sp>
<speaker>Fran</speaker>
<l>You come most carefully upon your hour.</l>
</sp>
<sp>
<speaker>Barn</speaker>
<l>'Tis now struck twelve. Get thee to bed, Francisco.</l>
</sp>
<sp>
<speaker>Fran</speaker>
<l>For this relief much thanks. 'Tis bitter cold,</l>
<l part="I">And I am sick at heart.</l>
</sp>
</div2>
</div1>
<add place="right">Now call'd <name xml:id="barnardo">Bernardo</name> &amp;
<name xml:id="francisco">Francesco</name>.</add>
</stage>
<sp who="#francisco">
<speaker>1.</speaker>
<l part="Y">STand: who is that?</l>
</sp>
<sp who="#barnardo">
<speaker>2.</speaker>
<l part="Y">Tis I.</l>
</sp>
<sp who="#francisco">
<speaker>1.</speaker>
<l>O you come most carefully vpon your watch,</l>
</sp>
<sp who="#barnardo">
<speaker>2.</speaker>
<l>And if you meete Marcellus and Horatio,</l>
<l>The partners of my watch, bid them make haste.</l>
</sp>
<sp who="#francisco">
<speaker>1.</speaker>
<l part="Y">I will: See who goes there.</l>
</sp>
<stage>Enter Horatio and Marcellus.</stage>
<div2 n="1" type="scene">
<head rend="italic">Actus primus, Scena prima.</head>
<stage rend="italic" type="setting">A tempestuous
noise of Thunder and Lightning heard: Enter
a Ship-master, and a Boteswaine.</stage>
<sp>
<speaker>Master.</speaker>
<p>Bote-swaine.</p>
</sp>
<sp>
<speaker>Botes.</speaker>
<p>Heere Master: What cheere?</p>
</sp>
<sp>
<speaker>Mast.</speaker>
<p>Good: Speake to th' Mariners: fall
too't, yarely, or we run our selues a ground,
bestirre, bestirre.<stage type="move">Exit.</stage>
</p>
</sp>
<stage type="move">Enter Mariners.</stage>
<sp>
<speaker>Botes.</speaker>
<p>Heigh my hearts, cheerely, cheerely my harts: yare,
yare: Take in the toppe-sale: Tend to th' Masters whistle:
Blow till thou burst thy winde, if roome e-nough.</p>
</sp>
</div2>
</div1>
<speaker>The reverend Doctor Opimiam</speaker>
<p>I do not think I have named a single unpresentable fish.</p>
</sp>
<sp>
<speaker>Mr Gryll</speaker>
<p>Bream, Doctor: there is not much to be said for bream.</p>
</sp>
<sp>
<speaker>The Reverend Doctor Opimiam</speaker>
<p>On the contrary, sir, I think there is much to be said for him.
In the first place ...</p>
<p>Fish, Miss Gryll — I could discourse to you on fish by the
hour: but for the present I will forbear ...</p>
</sp>
<speaker>Lord Curryfin</speaker>
<stage>(after a pause).</stage>
<p>
<q>Mass</q> as the second grave-digger says
in <title>Hamlet</title>, <q>I cannot tell.</q>
</p>
</sp>
<p>A chorus of laughter dissolved the sitting.</p>
- « 3.12 韻文・舞台芸術中の一節
- Home | 目次
3.13 コアモジュールTEI: コアモジュール¶
- 要素: abbr add addrLine address analytic author bibl biblScope biblStruct binaryObject cb choice cit corr date del desc distinct divGen editor email emph expan foreign gap gloss graphic head headItem headLabel hi imprint index item l label lb lg list listBibl measure measureGrp meeting mentioned milestone monogr name note num orig p pb postBox postCode ptr pubPlace publisher q quote ref reg relatedItem resp respStmt rs said series sic soCalled sp speaker stage street teiCorpus term time title unclear
↑ Contents « 2 TEIヘダー » 4 テキスト構造モジュール