-record
の追加-record
で以下のようにディレクトリを指定します。
% julius .... -record ディレクトリ名起動後、指定ディレクトリ以下に、認識が行われた単位ごとに音声データがファイルに順次記録されます。ファイル名は、認識を開始した時点のシステム時間を以下のように「年.月日.時分秒.raw」の形で表したものになります。
2004.0222.145324.rawファイル形式は RAW形式(ヘッダ無し), 16bit, monoral, 無圧縮です。
(注意:3.4 以降では WAV 形式に変更されました)
オプション -iwsp
を指定することで、辞書中の全単語の末尾に
実際には、以下のようにスキップを許す形でショートポーズモデル (sp model) が全単語の末尾に付与されます。
... a sp | b ... → ...-a+b sp | a-b+...ショートポーズモデルの名前はオプション
-spmodel
で指定します。デフォルトは "sp" です。また,このショートポーズモデルへの遷移にペナルティスコアを加えることで,ショートポーズの挿入を抑制することもできます.ペナルティスコアは -iwsppenalty
で指定できます(負の値).デフォルトは 0.0 (ペナルティ無し)です.
この -iwsp
はマルチパス版のJulius/Julianでのみ利用可能です。通常版の Julius/Julian では利用できませんのでご注意ください。
ただし、現時点では制約として、単語全体が省略可能な単語、すなわちその単語を構成する音素モデルがすべてスキップ遷移を持つ場合、そのような単語定義は Julius/Julianでは扱えません。単語単位での省略を行いたい場合は、言語モデルでその単語を飛ばした単語接続を定義するなど、言語制約のレベルで対処する必要があります。
この音響モデルのスキップ遷移への対応は、マルチパス版のJulius/Julianのみです。通常版の Julius/Julian では使用できませんのでご注意ください。
-iwspword
を指定することで、無音に対応する単語のエントリを辞書に自動登録することができます。辞書に追加される単語はデフォルトでは以下のような単語です。
<UNK> [sp] sp spこのオプションは、N-gramにおいて無音の位置が定義されていないときのためのものです。日本語では主に、読点「、」やその他の記号に無音モデルを割り当てることで発話文中の休止(=無音)の位置を言語的にモデル化する場合が多いですが、他の言語やあるいは日本語でも学習コーパスによっては、このような無音位置のモデル化が行われない場合があります。そのような場合に、このオプションを指定して辞書に無音に対応する単語エントリを追加することで、認識精度が向上することがあります。
-iwspword
で追加される単語のエントリは、 -iwspentry
で変更することができます。
% julius .... -iwspword -iwspentry "<UNK> [sp] sil"
configure
オプションおよび起動時オプションの一覧です。
configure
オプション:
-iwsp
(マルチパス版)
-iwsppenalty value
(マルチパス版)
-iwspword
(Juliusのみ)
-iwspentry wordentry
(Juliusのみ)
-spmodel modelname
-record directory