Download List

專案描述

Julius is an open-source, high-performance large vocabulary continuous speech recognition (LVCSR) engine for speech-related researchs and developments. With HMM acoustic model and language model, you can construct your own speech recognition system.

Moved to github: https://github.com/julius-speech/julius

System Requirements

System requirement is not defined

發布 2008-03-12 17:58
julius 4.0.1 (3 files 隱藏)

發布版本通知

Julius rev.4.0.1 is a bug fix release.
It is recommended for all users using 4.0 to use this release.

Now ALSA is the default audio API on Linux. You can still use
the old OSS interface by specifying "--with-mictype=oss" for
the configure script at compilation time.

Julius-4.0.1 は主に4.0のバグ修正が行われました.
4.0 を使用しているすべてのユーザは、このバージョンへの移行が推奨されます。

また,このリリースより,Linux では OSS に代わって
ALSA オーディオ API が標準となりました.
従来の OSS へ戻したい場合は,コンパイル時に
"--with-mictype=oss" を指定してください。

更動紀錄

4.0.1 (2008.3.12)
==================
New features:

A/D-in
- ALSA now become default on Linux instead of OSS.

Module mode
- "ACTIVATEGRAM", "DEACTIVATEGRAM" and "DELGRAM" now accepts
grammar name as arguments in addition to grammar ID number.
- new command "GRAMINFO" to get list of current grammars.


Fixed bugs:

A/D-in
- ALSA codes updated to work on 1.x drivers.
- segfault with "-48".
- segfault on MFCC input with zero frames with "-spsegment".
VAD
- CMN not working on spsegment/GMM-VAD/decoder-VAD with microphone input.
Acoustic model
- Error when no short-pause model defined in multi-path mode.
N-gram
- incorrect 2-gram prob on 1st pass with backward N-gram only.
- incorrect 1-gram prob for unknown words.
- fail to read some ARPA files with no back-off compaction.
- read failure or segfault on big N-gram with over 24bit entries.
- redundant index for back-off weights in some case.
Word recognition
- incorrect N-best output with "-output N" on word recognition.
Installation
- "make install" fails on cygwin.
Source code
- Static variables in functions that are not meant to be static
are made local.
- Global variables in search are moved to StackDecode.

4.0.1 (2008.3.12)
==================
仕様変更:

- Linux のデフォルトオーディオAPIを,OSS から ALSA に変更.

バグ修正:

- 音声入力
- ALSA ネイティブの入力が正しく動作しない
- "-48" オプション指定時に segfault
- "-spsegment" 指定時にMFCC入力でゼロフレームがあると segfault
- VAD関連
- ショートポーズセグメンテーション,GMM VAD, あるいはデコーダベー
スVADにおいて,セグメント間で CMN が効いていなかった
- 音響モデル関連
- マルチパスモード時,ショートポーズモデルが定義されていないと起動しない
- N-gram関連
- backward N-gram だけ与えられたとき第1パスの2-gramの値が正しくない
- 未知語エントリに対して確率が正しく割り当てられない.
- back-off の定義によっては読み込みに失敗することがある.
- 24bit以上のエントリを持つ巨大なN-gramの扱いに失敗する
- バックオフ係数の格納エリアが余分に malloc されていた.
- 単単語認識
- 単単語認識モードにおいて N ベスト出力 ("-output N") が正しくない
- インストール時の問題
- cygwin で "make install" に失敗する
- ソースコードの精錬
- 関数内の不要な static 変数をローカル変数に修正
- 探索部に残っていたワークエリア用大域変数を StackDecode に移動

新機能:

- モジュールモード
- "ACTIVATEGRAM", "DEACTIVATEGRAM", "DELGRAM" で文法を指定する際に,
文法 ID 番号だけでなく文法名でも指定できるようになった.
- 新コマンド "GRAMINFO": 現在の文法リストを返す.