iv ガイドラインについて

Contents

本ガイドラインは,TEI(Text Encoding Initiative)コンソーシアム が開発・管理しているものである( この詳細は,iv.ii 歴史的背景を参照のこと). 本ガイドラインは,各種のテキスト資料の電子版に携わる人に向けた ものである.

本ガイドラインでは,テキスト資料に含まれている,ソフトウェアで 処理されるためには特定化される必要ががある,素性を表示するに相応 しい手法を推奨している. 特に,電子テキストに挿入されるマーク(すなわちタグ)の集合を定義し ている. このマークは,テキストの構造や,関心の素性を示すために使われる. 殆どのソフトウェアでは,テキストに処理を施すためには,そのよう な明示的なマークが必要となる. そのようなマークがなければ,電子テキストは,何物としても表示さ れることはなく,一連のビット列としてのみ表示されることになる. 例えば,W3Cでは,そのようなマークを使い,見出しや,リスト,ペー ジ等の素性を示すことに,部分的ではあるが,成功している. また,ページ間にリンクを示すことにも成功している. このような明示的なマークを,暗示的なテキスト素性を示すために挿 入する作業は,「マークアップ」または「符号化」と呼ばれている. 「タグ付け」という用語も使われることがある. 「符号化スキーム(encoding scheme)」または「マークアップ言語」 という用語は,当該テキストにあるマークアップの使用ルールを決め た集合を示すために使われている. 「マークアップ語彙」とは,特定のマーク集合,または当該符号化 スキームで採用されている名前付きの単位の集合の事である. 本ガイドラインは,TEI符号化スキームを解説し,TEIマークアップ語 彙を解説するものとなる.

TEI符号化スキーマは,個人や研究機関が,異なるソフトウェア や,計算機システムを使う状況で,データを損失無く自由に交換する ことを促す,便利な仕組みである. このスキームには,よく使われるテキスト処理の素性が含まれている ことから,新しくシステムを構築する際や,新しいデータを作成する 際に,データ交換が主要な目的ではなかったとしても,本ガイドライ ンの内容は,出発点として役に立つことになる.

本ガイドラインは,全ての自然言語,時代,ジャンル,テキスト種 に対して,その形式と内容とに限られず,適応されるものである. 本ガイドラインは,連続するデータ(例えば,本文としてあるテキス ト)や,非連続のデータ,例えば,辞書や言語資料などにも適応され る. 本ガイドラインは,原則,学術研究からの要望に応えたものとなって いるが,必ずしもこれに限定されるものではない. また,本ガイドラインは,電子資料を管理・記録する司書や,電子テ キストを作成・頒布する出版者などにも役立つものである. 本ガイドラインでは,既存のメディアで既に表現されているテキスト を,電子テキストとして表現する際の問題点を主に扱ってはいるもの の,「生来デジタル(born digital)」なテキストにも対応可能である. また,本ガイドラインの内容は,現行ある電子テキストの取り扱いに 広く適応できることであろうし,また,それに限られるものでもない だろう.

本ガイドラインで示される規則や推奨内容は,現在,最もよく使 われている,各種の電子資料を表現するためのマークアップ言語であ るXML(Extensible Markup Language)で表現されている. XMLは,W3Cが推奨するマークアップ言語である. 但し,TEI符号化スキーム自体は,XMLに依存するものではない. TEI符号化スキームは,元は,XMLの前身であるマークアップ言語(ISO Standard Generalized Markup Language)で定義されていた. また,将来は,マークアップ言語の進展に伴い,別の枠組みで再定義 されることもあるだろう. マークアップ言語についての詳細は,v XML入門を参照のこと. また,符号化に関する文字の問題については,vi 言語と文字集合を参照のこと.

本ガイドラインでは,TEI符号化スキームの必要事項やその使い方を,信 頼のおける,完全な内容として提供するものである. 本ガイドラインには,数多くの例が含まれているが,これはチュート リアルを目的としたものではなく,参照マニュアルとしての機能を持 たせるためのものであることに注意して欲しい.

本章では,これ以降が,3つの節から構成されている. はじめに,本ガイドラインの構成と,採用されている表記法について 概説する. 次に,TEIスキームで採用されている編集方針と,その応用範囲を紹 介する. 最後に,TEIの簡単な歴史を紹介する.

iv.i 凡例

前付にある残りの2章は,マークアップ言語に不慣れな人向けの, チュートリアルとなる基本資料である. 本章の次にある章では,XMLについて詳細に解説する. これは,XMLスキームの初心者にも出来るだけ難なくそれを理解し てもらえるよう配慮して書かれている. この内容は,マークアップ言語一般と,XMLについて知っておくべ きものである. 続く章では,電子データにおける,異なる言語や書記システムの 表示が現行どのような方針の下にされているのかを紹介する. その章は,ユニコードに不慣れな人向けに用意されたものではある が,慣れ親しんだ人にとっても,歴史を概観した文章の中には,興味を 持つ内容があるかもしれない.

本ガイドラインの本文には,23の章があり,各章は,専門性にあわ せて並べられている. はじめの5章では,全てのテキスト種で重要になるだろう,TEIスキー ムについて,詳しく解説する. 続く7つの章では,特定のテキスト種について解説する. 具体的には,韻文,舞台芸術,発話されたテキスト,辞書,手書き 資料である. 続く9つの章では,広範囲のテーマを扱い,そのうちのいくつかは,各 種テキストの符号化でも,関心となるものである. 最後にある2章は,TEIスキーム自体を表現するためのXMLの書き方 と,その利用方法に関する技術的な情報を解説している. また,最後の章では,TEI準拠の考え方や,本ガイドラインを元 に作成されたデータを実際に交換することについても解説している.

先にも示したとおり,本ガイドラインは,参照資料としてあること を目的としており,始めから終わりまで精読されることを想定して いない. 但し,TEIスキームの可能性を理解したい場合には,はじめの4章と,最後 にある2章の内容を理解することが必要となる. 続いて,自らが関心を持つ章を,選択することが望ましい. TEIの強みのひとつとして,このようなモジュール性がある.

関連する項目には,出来るだけ相互参照を取るようにしている. これは,本ガイドラインの電子版の持つ特徴ともいえる. また,本ガイドラインでは,全ての要素,クラス,マクロの形式的 定義が,付録として収録されている. これらにも全て,リンクが張られている. また,最後には,詳細な参考文献のリストが用意されている. ここには,本文中で引用した例や,参考資料,参考文献が載せられ ている.

本ガイドラインを読みやすくするために,多くの章では,同じよう な構成になっている. 各章は,そこで扱われる内容の概説から始まり,具体的な各節への リンクが用意されている. 各節では,新たに導入される要素が解説され,まずはじめに,その 全体像が,要素名,意図される用法の簡単な解説により,表として 示される. 続いて,各要素の詳細が解説され,出来るだけ各種の実際の例を交 えている. 提示される例は,完全な形であることを意図するものではなく,当 該要素が使われる典型例を示すものである. この電子版では,出来るだけ多くの例にリンクを張るようにしている. 例の中にある,いわゆる空白文字,例えば,改行文字やインデント などは,読みやすさのために使われるもので,規範や既定に則った ものというものではない.

TEIの要素やクラスが解説される場合には,当該要素やクラスを定 義する参照ページへのリンクが用意されている. 要素名は,常に要素名という形式で表現され,この「要素名」とは「共通識別子(generic identifier)」の事である. 空要素,例えば,pbanchorを解説す る際には,タグ閉じのところで,スラッシュ記号を並記して いる. 属性を参照する際には,attnameという 形式で表現され,「attname」が属性名となる. クラスを参照する際にも,リンクが張られ,例えば,model.divLikeはモデルクラ スを,att.globalは属性クラ スを,それぞれ参照している.

編集方針

TEIスキーマは,元々,人文学研究から生み出されたことから,その 研究に応えることが目的となっている. 従って,網羅性,自在性,拡張性を高めることが求められている. 本ガイドラインの,より個別の目的としては,以下のものがある.
  • データ交換の規格形式
  • 本形式でテキストを符号化する際のガイドライン
  • 研究者が扱う全テキスト素性の符号化
  • ソフトウェアからの独立
これにより,以下にあるような,重要な編集方針が導かれること になる.
  • XMLとユニコードの採用
  • 膨大なタグ集合の規定
  • 複数の視点による同一テキストの符号化
  • 複数の手法による同一テキスト素性の符号化
  • 当該スキームをユーザが改変する機能
これらのいくつかの点については,以下で詳細に解説する.

ソフトウェアに依存しないデータ交換形式を作るには,要素とそ の意味を大量に定義することに加えて,その構文も定義する必要 がある. 本ガイドラインが推奨する構文は,W3Cが推奨するXML(Bray et al. (eds.) (2006))で定義されてはいるが,出来るだけ特定 のスキーマ言語から独立したものとして定義されている.

テキストの符号化向けのガイドラインでは,どの様なテキスト素 性を,各種の状況下で記録すべきかが,推奨されることになる. 但し,本ガイドラインでは,ある特定の素性を符号化の対象とし て選択する際,出来るだけ多様な視点に対応できるよう,共通認 識がないような状況は避けて,一般的な解決策を選択するようにし ている. 結果として,本ガイドラインは,(まれな例外を除いて)相対的に 重要なテキスト素性となるようなものについては,提案も制約も 用意してはいない. 本ガイドラインでは,「その素性を記録したいのであれば,そう してください」という哲学を採用している. 但し,いくつかの素性については,記録を必須としている. 同様に,本ガイドラインでは,まれに特定の素性を符号化するこ とを求めることがあるが,それは,符号化する人が,どの素性を 記録するのかに関して,誠実であるよう求めるものである. 具体的にいえば,その素性を記録したことについて,特定の要素 や属性で記録することを求めることになる.

研究で使われる全ての資料に対応することが求められていること から,TEIの開発には,柔軟性が求められ,モジュールシステム が採用されることになった. XMLを採用した他の規格や語彙集の開発では,ある特定の,定義 された応用分野で使われる符号化スキームをひとつ作ること が,一般には,目的となっている. それに比べて,TEIは,定義が確立していないような,時にオー バーラップする,多くの分野で使われることが想定されている. 従って,1 TEIの基礎構造で解説されるモジュールを使い,一 般性を確保することになる. これにより,データの可換性を損なうことなく,必要とされるス キーマを新たに作ることが可能となる.

本ガイドラインの多くは,テキストを作成する(原稿が存在しな い)場面よりも,テキストを取り込む(すなわち,他の媒体上に既 に存在するテキストを原稿として,電子形式に再表示 する)際に使われる内容である. 従って,「転記」「元資料」という用語はよく使われることにな る. もちろん,本ガイドラインの内容は,テキストを作成する場面で も使うことができる.

本ガイドラインでは,テキストの取り込みについて,元資料との 同一性に関する問題や,その再現性について,特定の手法を提案 するものではない. どの手法を採用するかは,符号化する人が責任を負う問題である. 但し,本版では,修辞的,言語学的,印刷上の特徴を記録するた めのタグ集合を,ページレイアウトや,字形,筆写者向けのタグ 集合よりも,多くを規定している. また,本版では,符号化されたデータから,マークアップを削除 するだけで,元のテキストが再現できるような環境を,もはや必 須とはしていないことに注意して欲しい.

本ガイドラインは,「客観的」情報や「主観的」情報,「表示的」 や「解釈的」という対立項目に,厳密な区別を求めていない. この様な区別は,それが広く使われているか,よく定義されてい るか,状況が明確であるかなどとは関係なく,学術界でそのコン センサスがあるか無いかという基準で成立させる方がよい. そのようなコンセンサスは,これまでも,これから も,変化するものである. 本ガイドラインでは,この様な素性の符号化に関して,提案や規 制を設けることはしない. 本ガイドラインでは,「記述的」と「解釈的」という用語を,理 論上の問題における特定の立場を指示するために使うことはして いない. これらの用語は,これまでにガイドラインが作られてきた過程(iv.ii 歴史的背景)の中で使われてきた意味を反映するだけである.

一般には,符号化の正確性や信用性,解釈の適切性は,当該テキ ストを作成する個人に依存するものである. 本ガイドラインでは,電子化テキストの利用者が,その符号化の 仕方や,その背景にある解釈がどの様に決められたかを知ること が出来るように記録をしておく手法を用意している. TEIヘダーは,この様な符号化に関する各種の情報を記録するた めに使われることになる. 但し,特定の素性向けに用意されているTEI要素を選択し,使っ ていること自体が,符号化する人がそのように解釈したという証 にもなっている.

多くの場合,ひとつのテキストには,複数の視点による符号化が 必要となる. 全てのテキストに対応する,ひとつの視点というものはなく,全 ての解釈に対応するひとつの視点というものはない. 従って,推奨できるようなひとつの視点というものはない. XMLでは,統語上に制約を課すことで,ある目的のために,ある 符号化方法を無視することができるようになっている. 本ガイドラインでは,複数の視点を符号化するために,各種のテ キスト素性を扱うだけではなく,ある特定のテキスト向けの符号 化方法を選択するようなこともしている. 本ガイドラインでは,当該テキストに複数の視点を,必要であれ ば同時に,符号化できる機能を用意している. 但し,XMLでは(テキスト構造として,ひとつの階層構造を求めて いることから),ひとつの統語構造に,異なる視点による複数の アノテーション構造を反映させようとすると,問題が生じる. この様な制約を乗り越える手法として,推奨される手法が 20 非階層構造で解説されている.

まとめると,TEIガイドラインは,一般的な用途向けの符号化ス キームを定義している. このスキームは,テキストの複数の異なる視点を符号化する ことが出来るようになっている. これは,人文学研究におけるテキスト研究の多くに対応できるよ う,各種の応用例で使えるように意図したからである. 既定されている符号化スキームが,全ての研究目的に対応できる ことは無い. 従って,TEIスキームでは,多くの既定のマークアップから選択 できるような仕組みを用意し,更に,新しい(TEIではない)マー クアップも選択できるようになっている. TEIでは,TEIの規定が拡張されているかを検証する公式の手法を 用意しているので,利用者は,容易に,自らの拡張した部分を, 将来のTEIガイドラインにおいても対応するものとして,使うこ とができるようになっている. スキームに関するこの様な機能の基礎については1 TEIの基礎構造で解説され,さらに詳細な手法につ いては23 TEIの使い方で解説 されている.

想定した使用場面

本ガイドラインの内容には,3つの目的がある.
  • テキストの作成やデータの取り込みをする際のガイダンス
  • データ交換の支援
  • ソフトウェアから独立する支援
これら3つの機能は,実際の運用時には,相互に関連し合い,ど れかを独立して示すことは困難である. 但し,これら3つの機能を分けておくと,実際の電子テキスト を扱う場面における,本ガイドラインの役割を解説する際には,便利な 枠組みとなる.
テキスト作成・取り込み

本ガイドラインの各章では,各種のテキスト素性が解説されて いる. これは,電子テキストを作成する際に,自らのプロジェクトに 相応しい素性を選択する際の,便利なチェックリストになるだ ろう.

本ガイドラインの,これまでの版では,テキストを作成する際 に限定される問題を,明示的には扱ってこなかった. 本ガイドラインは,電子テキストが生み出される過程について は,配慮をしていない. 例えば,手で入力されたり,印刷書籍からスキャナーで取り込 まれたり,パンチテープから入力されたり,他の研究者が使っ ていた他のマークアップスキームの(または,全く明示的なマー クアップはない)データから取り込んだりする過程である.

本ガイドラインでは,マークアップや,テキストの取り込み過 程で問題となる,一般的な論点のみを扱っている.

XMLは,時に,面倒なほど冗長なデータとなる. とりわけ,(本ガイドラインでもそうなのだが)要素と属性の名 前は,明らかであることが優先され,簡潔さを優先して選ばれ てはいない. 編集ソフトのマクロやキーボードのショートカットを使うこと で,少ないキー入力で,よく使われる要素を入力することも可 能ではある. また,自動的に,テキストを入力したり,取り込んだりするこ とも可能である. マークアップに対応したソフトウェアであれば,文書構造を確 保する機能が付いているであろうし,タグをそのまま見せるこ となく,視覚的に書式付けして文書を表示することもできるで あろう.

23.2 Personalization and Customizationで解説されている機能は,TEIに準拠した データを取り込むスキーマを改変することができる. 例えば,要素の数を制約したり,よく使う要素の名前を短くし たりすることが出来る. そのようなスキームで作られた文書は,自動的に,適切なTEI データへと変換されることになる.

データ交換

TEIデータ形式は,データ交換のために使うことができる. これにより,符号化スキームが異なる場合でも,プロジェクト 間でデータを共有することができる. n個の異なる符号化形式がある場合,それらの対応付けには,n*(n-1)個の翻訳が必要になるが,データ交換向けの形式があれば,2n個の対応付けで済む. 但し,データ間で情報の損失無く翻訳をするには,データ交換形式は,対象となるデータを十分に表現できなければならない. そのために,TEIは,高度に抽象的で一般的な符号化の手法や,特 化した手法の両方を備えている.

2つの異なる符号化スキームを翻訳するためには,以下のこと が必要となる.
  1. 2つのスキームで異なるテキスト素性を特定する.
  2. 対応する2つの素性の場所を特定する.
  3. 適切な対応関係を作る.
例えば,符号化スキームXを,TEIスキームに翻訳するために は,以下の手順が必要となる.
  1. スキームXで区別されているテキスト素性のリストを作る.
  2. TEIスキームで,それに対応する素性を特定する. これには,3つの可能性がある.
    1. 素性が,スキームXとTEIスキームの両方に存在する.
    2. 素性が,スキームXには存在するが,TEIスキームにはない.
    3. スキームXに存在する素性に対応する素性が,TEIスキームには複数ある.
    第一のケースでは,単純に名前を変えればよい. 第2のケースでは,TEIスキームを拡張する必要がある. これは,23.2 Personalization and Customizationで解説されている. 第3のケースは,やっかいではあるが,対応できないこと はない. この場合は,選択の場面全てにおいて,同じく選択 (そして記録)を実行する必要がある.

もちろん,この様な翻訳が簡単に定義できるかどうかは,スキー ムXが当該の素性に明確に対応しているかにかかっている.

TEIスキームからスキームXへの翻訳においても,似たような事 になるが,但し,TEIの素性に対応するものがスキーマXには存 在せず,スキーマXの拡張も出来ない場合には,翻訳の過程で 情報は欠落することになる.

本ガイドラインの内容に準拠するという基準については, 23.3 Conformanceで詳細を解説する. 準拠するという基準の基本的な考え方は,以下のようにまとめ ることが出来る.
  • TEIの「抽象モデル」(すなわち,TEIが定義する分割方法) に対応している. 本ガイドラインで定義されている,タグXと,そのタグに 付与されている意味機能との対応関係が,変化無く保たれ ている. この変化は「タグ乱用(tag abuse)」とされ, 強く避けられている.
  • TEI文書は,妥当なXML文書である. また,適切にTEI名前空間が使われている. 例えば,当該文書が,本ガイドラインにはない素性を符号 化している場合,この拡張部分は,TEI名前空間とは相容 れない可能性がある.
  • TEI文書は,本ガイドラインが示すスキーマとは異なる場 合もある. 例えば,推奨する手法に則り,拡張を施した場合である.
ローカル処理
機械可読テキストは,様々な処理が可能となる. 例えば,以下のようなものがある.
  • テキストを編集する(例えば,ワープロソフトや,書き方に 制約のあるエディタを使う).
  • ハイパーテキストを扱えるソフト上で,テキストを編 集,表示,テキストにリンクを付ける.
  • DTPシステム上,または,バッチ式の書式付けソフトを 使い,テキストを整形,印刷する.
  • テキストを,全文検索向けデータベースや一般的なデー タベースに載せる.
  • データベースから,検索結果を取り出したり,他のソフ トウェアにデータを移動するために,データベースからテキ ストを取り出す.
  • テキストから語句を検索する.
  • テキストの内容を分析する.
  • テキストを校合する.
  • 自動索引付けなどの準備として,テキストを取り込む.
  • テキストの言語を分析をする.
  • テキストの文体を分析する.
  • 韻文の韻律を分析する.
  • テキストと画像をリンク付ける.

このリストは,多くを載せてはいるが,全ての応用場面を網羅 するものではない. TEIガイドラインの目標として,同じテキストを,異なる目的 で使用することを前提に符号化することにも対応することがあ る. あるテキストが,他の応用場面で再利用される際に,制限があ ることは避けたい. 同時に,ひとつの応用でしか使えないようなものも排除するよ うにしている.

TEIデータ形式は,XMLで表現されることから,現在ある多くの テキスト処理システムで,TEIデータを扱うことが出来る. また,TEIに対応する新しく開発されるソフトウェアの元では,既 存のソフトウェアのライブラリも使うことができている.

iv.ii 歴史的背景

TEI(Text Encoding Initiative)が誕生したきっかけは,1987年11 月にVassar Collegeで開催された,Association for Computers and the Humanities (ACH)がスポンサーで,U.S. National Endowment for the Humanities (NEH)から資金を受けた会議を計画 したことから始まる. この会議では,テキストのアーカイブ関係,学術界,研究プロジェ クトなどから約30の代表者が集い,標準符号化スキームの可能性を 検討し,その対象領域,構造,内容,草案を提言としてまとめた. この会議の期間中に,Association for Computational Linguistics (ACL)とAssociation for Literary and Linguistic Computing(ALLC)は,ACHと共に,このガイドラインを作成するプロ ジェクトのスポンサーとなることになった. この会議の成果は,「ポキプシー案」(Burnard (1988))としてまとめられ,TEIの活動の 道筋を決定づけたものになっている.

TEIは,1988年6月に,正式に発足した. これは,NEHの資金によるものであるが,すぐに,Commission ofthe European Communitiesや,Andrew W. Mellon Foundation,Social Science and Humanities Research Council of Canadaからも資金援助を受けた. 4つの委員会が結成され,ヨーロッパと北米からの一流の研究者 によって構成された. 4つの委員会とは,ドキュメンテーション(text documentation), 表示関連(text representation),分析・解釈(text analysis and interpretation),メタ言語と統語規則metalanguage and syntax issues)である. 各委員会では,テキストの「特質」を特定する作業にあたり,2人 の編集者が,それぞれの成果を整合させるために調整した.

本ガイドラインの草案第1版(P1)は,Guidelines for the Encoding and Interchange of Machine-Readable Textsとして,1990年7月に出版され た. 多くのコメントや,第1版では扱われなかった領域での検討結果が 加えられ,ガイドラインの草稿第2版(P2)は,1992年4月に出版され た. この第2版には,1990年から1991年にかけて結成された,P1の見直 しを検討する専門家によるワーキンググループの成果として,かな りの量の新しい内容が含まれている. 第1版に寄せられたコメントを反映し,草案と,そこで示されてい るスキームの全体構造が,大幅に改訂された.

1993年6月に,TEI諮問委員会(Advisory Board)が構成され,そこで 第2版ガイドラインの検討と,これまでの成果を正式に出版するこ とが提案された. これは第3版(P3)となり,P2の一部を強化し,いくつかの新しい内 容を含むことになった. P3は,1994年5月に,「草案」という文字が外された正式版として出版された. これは,TEIガイドライン開発の,到達点となった.

W3Cは,1998年2月に,XMLの最終勧告を発表した. 1 XMLの急速な普及により,(SGMLを元にしていた)TEIガイドライン も,将来のためには,XMLに対応することが必要となった. TEIガイドラインの編集者は,他の関係者から多くのアドバイスを もらいながら,改訂計画を検討し,統語上の問題について,解決策 の試案を作り上げた.

1999年1月に,University of VirginiaとUniversity of Bergenは,正 式に,TEIコンソーシアムの立ち上げを提案し,そこでTEIガイドラ インの開発,管理,利用促進を執り行うこととした. その後まもなく,2つの機関(Brown UniversityとOxford University)がTEIに参加し,TEIを管理・運営するコンソーシアムの 立ち上げの同意書(An Agreement to Establish a Consortium for the Maintenance of theText Encoding Initiative (March 1999) )の策定にあたった. これを元にして,2000年末に,TEIコンソーシアムが,非営利団体 として,正式に発足した. この新しいTEIの評議委員は,2001年1月に就任された.

TEIコンソーシアムは,TEIを管理する常設機関として設立された. TEIコンソーシアムは,民主的に構成され,学術・経済の面では独 立した団体であり,自立した,非営利組織である. また,TEIコンソーシアムは,TEIガイドラインの開発と利用促進を 担う,広範囲にわたる参加者のコミュニティを形成することも目的 としている(Burnard (2000)).

TEI評議委員は,TEIガイドラインの編集者と共にTEIガイドライン の改訂作業を担うTEI技術会議を,TEIの利用者から選任されたメン バーから構成し,発足させた. TEI技術会議の初会合は,2002年1月に,King's College Londonで 開かれた. TEI技術会議の初仕事は,TEIガイドラインのXML対応版を監督する ことであった. これは,P3を元にして,新しくXMLにも対応できるようにする作業 であった. この成果は,第4版(P4)として,2002年6月に出版された. このP4は,実質上,XMLに対応したP3となっている. 従って,XMLに対応して変更する必要がある箇所以外には,実質的 な変更はない. 但し,P3にあった間違いは修正されている. 1994年からこの時点まで,P3の内容は,変わらずにいたことから, その内容は,本格的に修正される必要があることは明らかであった. そこで,この内容の修正作業は,第5版(P5)の作業としてすぐに取 りかかられた. 内容の修正作業は,全般的なものとして計画され,利用者からの要 請に応えて,素性の修正だけではなく,従来の版では扱っていなかっ た内容までも対象となった. 例えば,文字の符号化方法,画像,写本,紳士録,地理情報, 当該ガイドラインそのものを記録する方法などである.

TEI会議のメンバーと関連する会議のリストはiii 序文に載せてある. 本版を作成するにあたり,TEI会議のメンバーと各会議は,TEIの利 用者の幅広い要求や利用場面に配慮している. TEIを利用する人は,今では,世界中の数多くの研究コミュニティ に散在している. TEI会議のメンバーと各会議は,助成付きの国際研究で扱われたTEI の成果を,各個のの自立した研究コミュニティへと還元する機関に もなっている. TEIを通じた共同作業がもたらしたひとつの成果として,TEIコンソー シアムのメンバーが会合する年会が開催されることが挙げられる. この会合は,TEIのコミュニティを維持し,強化する,とても重要 な機会となっている.

本ガイドラインの内容は,多くの専門家による,連綿とした協議, 草稿作り,改訂の成果である. 本ガイドラインから享受される利点の全ては,この様な活動に参加 した人々に依るものである. 本ガイドラインにある誤りの責任は,本ガイドラインの編集者にある.

iv.iii 今後の予定

本ガイドラインで推奨されている符号化方法は,これから策定され るTEIスキーマとの互換性が,根本的には問題にならないものとし て,使うことができると考えられる. TEIは,将来,ガイドラインを改定する際,本ガイドラインに従っ てデータを作成している人と関連する問題には,敏感であり続ける.

P5では,版番号の仕組みを採用している. 版番号は,2つの部分から成り,主たる版番号と,小さな改訂の版番号が あり,この2つは,例えば1.0のように表記される. TEIでは,同じ主たる版番号においては,形式的な表現(23.3 Conformanceで規定 されているTEIスキーマ)に変更をもたらすことはなく,その元にあ る小さな改訂の版番号の内容はそのまま使えるようになっている. また,出来る限り,小さな改訂の版番号は,既存のものに変更を加 えないような素性の追加や,誤りの修正を施したときのみに,変更 されるようになっている.

本ガイドラインは,現在,オープンソースプロジェクトとして管理 されている. サイトSourceforgehttp://tei.sf.netから,新しい版を 自由に入手することが出来るようになっている. 見つけた間違いや,要望についても,このサイトから受け付けるこ とが出来るようになっている.

Contents « iii 序文 » v XML入門

注釈
1.
XMLは,web上で,web文書を精緻に符号化するための仕組みとし て開発されたもので,これはTEIの目指すものと似ている. TEIに参加する人の何人かは,XMLの開発に重要な貢献をしてきた. 例えば,XMLの編集者の一人であるC. M. Sperberg-McQueen氏 は,1999年の当初から,TEIガイドラインの北米担当の編集者でもある.


Copyright TEIコンソーシアム 2007 Licensed under the GPL. Copying and redistribution is permitted and encouraged.
Version 1.0.