sclip(Sound Clip)の使い方

sclipは，音声データ(wave/wav形式)の中から，指定した時間の部分音声を切
り出し，ファイルとして保存するためのプログラムです．

sclipはjavaプログラムです．従って，javaが既にインストールされている環
境でのみ動きます．必要とするjava環境は，JRE1.4以上です．

sclipはコマンドラインで使用するプログラムです「コマンドプロンプト」を
立ち上げてお使い下さい．

#############
使用例：その１
sclip [入力ファイル] [開始時刻] [終了時刻] [出力ファイル]

開始時刻と終了時刻は，[hh:mm:ss]の形式か，または総秒数で示すことができ
ます．秒数は実数(小数点以下の)表記が使えます．これは，以下にある全ての
使い方で共通する時刻指定の方法です．

#############
使用例：その２
sclip -f [バッチファイル]

バッチファイルの中に，入出力ファイルと時間情報を，複数まとめて書いてお
くことができます．書き方は，CSVファイルの要領で，各項目をカンマ「,」で
区切ってください．空白を入れてはいけません．

例
[入力ファイル],[開始時刻],[終了時刻],[出力ファイル]

具体例
sample1.wav,10,0:20:10.5,test1.wav
sample1.wav,20,00:12:20,test2.wav
sample2.wav,30,00:20:30.5,test3.wav

出力ファイル名が指定されていない場合には，入力ファイル名に自動的に3桁
表記の連番が付加されたファイル名で保存されます．
なお，このバッチファイルはGISTフォーマット(General Time Information
for Linguistics)に従って書くこともできます(Ohya 2015, ICLDC4)．

#############

同じ入力ファイルから複数の部分音声を取り出すときには，これ以降の方法を
使った方が処理が速く済みます．

#############
使用例：その３
sclip -a [入力ファイル] [リージョンリストファイル]

1つの音声ファイルから，[リージョンリストファイル]にある時間情報を元に
複数の部分音声を作ることができます．時間情報の書き方は，CSVファイルの
要領で，各項目をカンマ「,」で区切ってください．空白を入れてはいけませ
ん．

例
[開始時刻],[終了時刻],[出力ファイル]

具体例
10,0:20:10.5,test1.wav
20,00:12:20,test2.wav
30,00:20:30.5,test3.wav

出力ファイル名が指定されていない場合には，入力ファイル名に自動的に3桁
表記の連番が付加されたファイル名で保存されます．
なお，このバッチファイルはGISTフォーマット(General Time Information
for Linguistics)に従って書くこともできます(Ohya 2015, ICLDC4)．

#############
使用例：その４
sclip -c [入力ファイル] [リージョンリストファイル]

1つの音声ファイルから，[リージョンリストファイル]にある時間情報を元に
複数の部分音声を作ることができます．時間情報の書き方は，CSVファイルの
要領で，各項目を空白文字「 」で区切ってください．

入力ファイルは指定した1つを使います．[リージョンリストファイル]には，
CSV形式(カンマ区切)で「[開始時刻],[終了時刻]」を，各行で指定します．

具体例
00:04:39.3 00:05:15.0 01.wav
00:07:25.8 00:08:07.4 02.wav
00:11:08.7 00:12:11.1 03.wav

出力ファイル名が指定されていない場合には，入力ファイル名に自動的に3桁
表記の連番が付加されたファイル名で保存されます．

#############
使用例：その５
sclip -s [入力ファイル] [リージョンリストファイル]

1つの音声ファイルから，[リージョンリストファイル]にある時間情報を元に
複数の部分音声を作ることができます．時間情報の書き方は，CSVファイルの
要領で，各項目を空白文字「 」で区切ってください．

具体例
00:04:39.3 00:05:15.0 01
00:07:25.8 00:08:07.4 02
00:11:08.7 00:12:11.1 03
00:13:46.2 00:14:57.5 04
00:01:23.2 00:02:28.6 05
00:01:23.2 00:02:28.6 06

オプション-cの使用例４とは異なり，出力ファイル名は必ず指定してください．
なお，[リージョンリストファイル]は，Sony Sound Forgeが作成するリージョ
ンリストファイルを使うことができます．このファイルは，以下の形式になっ
ています．

例
start_region_table
[開始時刻] [終了時刻] [名前]
..
end_region_table

「start_region_table」と「end_region_table」の行は処理の際に無視されま
すので，あってもなくても問題なく動きます．

#############
使用例：その６
sclip -e [入力ファイル] [リージョンリストファイル]

リージョンリストファイルに，アノテーションソフトELANが作成するデータファ
イル(eaf)を使います．ELANでは，メニュー「ファイル」->「新規作成」で音
声ファイルを選択します．続いて，音声の範囲を選択して，メニュー「注
釈」->「ここに新規注釈を作成」(Alt-N)で，注釈/ラベルを入れることができ
ます．入力したラベル付きのリージョンリストは，メニュー「ファイ
ル」->「名前を付けて保存」で，eaf形式のファイルで保存します．
sclipでは，このラベルをファイル名の一部に付けることができません．ELAN
が自動的に付けたIDを，ファイル名の一部に使います．

#############
使用例：その７
sclip -o [入力ファイル] [リージョンリストファイル]

リージョンリストファイルに，音声処理ソフトAudacityが作成するリストを使
います．Audacityのメニュー「トラック」->「選択範囲にラベルを付ける」
(Ctrl-B)で，範囲が選択され，ラベルを付けることが出来ます．入力した範囲
とラベルは，メニュー「ファイル」->「ラベルの書き出し」で保存します．
sclipでは，ラベルをファイル名の一部として使用します．ラベル名が重複す
ると，作成された部分音声ファイルは上書きされてしまいますので，注意して
下さい．

#############
使用例：その８
sclip -p [入力ファイル] [リージョンリストファイル]

リージョンリストファイルに，音声処理ソフトPraatが作成するリストを使
います．Praatでは，メニュー「Open」->「Read from file...」(Ctrl-O)から
音声ファイルを選択します．続いて，右の列のメニュー「Annotate」->「To
TextGrid」を選択します．続いて，左の列にある音声ファイルと，アノテーショ
ンのファイルの2つを選択の状態にします．続いて，右の列のメニュー「View
& Edit」を選択します．Praatでは，ある時間軸を選択すると，下にあるアノ
テーション領域に○が現れ，それを選択すると，時間点を定義できます．時間
点と時間点の間には，ラベルを入れることが出来ます．入力した時間点とラベ
ルによるリージョンリストは，メニュー「File」->「Save TextGrid as text
file」で保存します．
sclipでは，ラベルをファイル名の一部として使用します．ラベルが付いてい
ない範囲は抽出されません．ラベル名が重複すると，作成された部分音声ファ
イルは上書きされてしまいますので，注意して下さい．

#############
使用例：その９
sclip -v

バージョンを示します．

このソフトウェアは，LingDyプロジェクト
(https://sites.google.com/site/lingdytextarchive/)
で作り始められ，科学研究費基盤研究(B)(課題番号23401025)ならびに
科学研究費基盤研究(C)(課題番号26370512)の助成を受けながら管理をされて
きた，学術目的のソフトウェアであるため，エラーの対応は親切ではありません．

各種のお問い合わせ，ご要望は，大矢までお願いします．

2014-01-28 OHYA Kazushi <!-- 大矢一志 -->
oya-k@tsurumi-u.ac.jp
