中川 聖一・鹿野 清宏・東倉 洋一:音声・聴覚と神経回路網モデル |
作成日: 2013-01-06 最終更新日: |
ニューロサイエンス&テクノロジーシリーズの一つである。
ニューロとは全く関係なく、最初に音声分析にあたっての基礎が述べられる。 まず、音声のモデルとして、音響管モデルと線形システムモデルの2種類があることが 同書では述べられている。 線形システムモデルはいわゆる ARMA モデルであるのでここでは省略し、 もう一つの音響管モデルを紹介しよう。 このモデルは、声道を部分的に断面積の変化する一次元の音響管路と考えるモデルである。 その導出は次のようである。
声道内の音波の伝搬方程式は、
`U=U(x, t):` | 声道内呼気流の体積速度`[cm^3//s]` |
`A=A(x):` | 声道の横断面積`[cm^2]` |
`C` | 声道内の音波の伝搬速度`[cm//s]` |
とすると次の波動方程式で表される。これは、 ウェブスターのホーン方程式(ホルン方程式)と呼ばれる。
`Adel/(delx)(1/A (delU)/(delx)) - 1/C^2((del^2U)/(delt^2) ) = 0`
これを適当な境界条件で解くことを考える。そのためここで、`U=U(x)e^st` と変数分離できるとする。 ここで、`s=sigma + jomega` は複素周波数とする。 すると上式は、次のようになる。
`(d^2U)/(dx^2) - 1/A (dA)/(dx) (dU)/(dx) - 1/C^2 U = 0`
この式は、管が不均一である、すなわち `A` が `x` の関数であることから、 電気回路論における不均一線路の線路方程式になる。 管の不均一性を近似するために、区分的に均一な長さ`Deltaℓ`の円筒を下の図のように直列に接続する。 特性は長さ`Deltaℓ`によって決まる時間遅れ`tau = Deltaℓ//c` と隣接区間の接続部におけるインピーダンスの不整合による反射係数 `gamma_i` とで表される。 下の図で、左側が声門方向、右側がくちびる方向としよう。 声門からくちびる方向への前進波を`F_i`、くちびるから声門方向への後進波を`B_i` としよう。すると、 次の方程式が成り立つ。
`F_i(t + tau) = (1 + gamma_(i-1))F_(i-1)(t) - gamma_(i-1)B_i(t)`
`B_i(t + tau) = gamma_i F_i(t) + (1 - gamma_i)B_(i+1)(t)`
`A_i` と `A_(i+1)` の境界面では、前進波は反射波 `F_(ir)` と透過波`F_(ip)` に分かれる。 同様に後進波は反射波 `B_(ir)` と透過波`B_(ip)` に分かれる。以上から、次の式が成り立つ。
`F_(ip) = (1 + gamma_i)F_i`
`F_(igamma) = gamma_iF_i`
`B_(ip) = (1 - gamma_(i-1))B_i`
`B_(igamma) = -gamma_(i-1)B_i`
`F_i(t + tau) = F_(i-1p)(t) + B_(ir)(t)`
`B_i(t + tau) = F_(ir)(t) + B_(i+1p)(t)`
`gamma_i = (Z_(i+1) - Z_i) / (Z_(i+1) - Z_i) `
最後の式は、第 `i` 区間の音響管の特性インピーダンス`Z_i` から反射係数 `gamma_i` を求める式であるが、 これをそのままとっては 1 にしかならないので誤植であろう。しかし、 正しい式がわからないのではどうしようもない。
表記にはASCIIMathMLを、レンダリングには MathJax を使っている。
書 名 | 音声・聴覚と神経回路網モデル |
著 者 | 中川 聖一・鹿野 清宏・東倉 洋一 |
発行日 | 1990年8月 |
発行元 | オーム社 |
定 価 | 円(本体) |
サイズ | ??版 |
ISBN | ??? |
007.1 | |
その他 | ?? |
まりんきょ学問所 > 読んだ本の記録 > 中川 聖一・鹿野 清宏・東倉 洋一:音声・聴覚と神経回路網モデル