このファイルは、3年春学期科目「音声情報処理」の授業において、口頭で説明する内容をテキスト(.txt)に書き起こしたものです。 事前に科目のHPにアクセスして「講義ノート」の PDF ファイルをダウンロードし、印刷しておいてください。このテキストには講義ノートの記述より多くの情報を含んでいます。講義ノートの行間に、テキストの説明を書きこんで行くことをお勧めします。最後にプリントを綴じれば、将来必要になったときに見返せる自分の「講義ノート」ができあがります。 「学生用ページ」「レポート提出システム」 から、その日の「宿題」レポートを提出してください。 〆切は 次回授業日の前日 23:59 です。 _/_/_/ 第二回 音声のスペクトル分析 _/_/_/ 【講義ノート】音素とアロフォン さて、それではまず「音素」という概念を学びましょう。「音素」、本によっては「音韻」と書いてあることもありますね。音素も音韻も英語ではどちらも「phoneme」といいます。同じ言語学的概念です。 1935年にトゥワデル先生が書かれた「On defining the phoneme」という論文の中で、この音素の考え方が出てきます。音素とは何か、一言でいうと 「意味の違いを生じせしめる最小自由形式」ということです。 出てきましたね。「意味」。思い出してください。意味の伝達に使用される声を「音声」というんでした。 ある異なる音響的特性を持つ2つの声の断片が、ことばの意味の違いにつながるとき、それらは違う音素である可能性がある。例えば、「あさ」と「あざ」は意味が違いますね。もしかしたら音素かもしれない。 音素という体系のもう一つの特徴は、それが「最小自由形式」であるということです。最小自由形式ってことばが難しいですね。ここでは、なるべく小さい単位にすると考えておきましょう。 「あさ」と「あざ」の違いを「a s a」と「a z a」の違いとみて、「s」と「z」の音素が違うと考えるわけです。 意味の違いを生じせしめる最小自由形式。これが音素です。 さて次に「アロフォン」という概念について説明しましょう。最小の音響的特性の違いが、ことばの意味の違いに結び付くのが音素でしたが、音響的に異なっていても意味の違いに結び付かないものがあります。すなわち、 同一音素に属すが異なる音響的特徴を持っている 声の断片、これがアロフォンです。 例えば「かしわもち」ってありますね。5月に食べるやつ。これを、口が絡まって「かすぃわもち」って発音したとしても、誰も違う意味のことばとは思わない。 日本語では、「∫」と「s」は違う音素として扱いません。これはアロフォンなんだ、ということになります。 ただし、英語では「s」と「∫」は違う音素です。言語によって違うので注意しましょう。 【講義ノート】音素とアロフォン(2) さて、音素や発音記号を標記するときに「/」で挟んで表現します。覚えておきましょう。 /s/ と書いて「s という音素」を表します。 /s/ と/∫(ロングエス)/ は大きくスペクトル、すなわち大きく音色が異なるが、意味の違いが生じないので同じ音素。 ちょっと脇道、この「i.e.」というのは「イドエスト」と読みます。「すなわち」という意味です。覚えておきましょう。 /∫/ は /s/ のアロフォンということです。 五十音のサ行を音素で書くと、このようになります。イ段の摩擦音が /∫/ になります。 【講義ノート】日本語の音素分類 音素の体系は言語によって違います。日本語の音素にはこのような種類があります。 ただし、外来音は含めていません。「母音」「子音」「半母音」の3種類に大別されます。 「母音」は関東の研究者は「ぼいん」関西では「ぼおん」と発音するようです。 関東では「ぼいん」「しいん」「はんぼいん」、 関西では「ぼおん」「しおん」「はんぼおん」、 母音には次の5種類があります。それぞれ「い」「え」「あ」「お」「う」です。 何故「あいうえお」順じゃないのか、それはまた後で。 子音はたくさんあります。 /p/, /t/, /k/, /b/, /d/, /g/, /m/, /n/, /z/, /s/, /c/, /h/, /r/, /N/ /N/ はナ行の音でなく「ン」の音。撥音といいます。 半母音は2種類です。 「やゆよ」の/j(ヨット)/、「わ」の/w/です。 【講義ノート】日本語の典型的アロフォン サ行(/s a/, /sh i/, /s u/, /s e/, /s o/) タ行(/t a/, /ch i/, /ts u/, /t e/, /t o/) ハ行(/h a/, /h i/, /f u/, /h e/, /h o/) ダ行(/d a/, /z i/, /z u/, /d e/, /d o/) 鼻濁音(/g/, /ng/) 母音 /i/ に先行する子音がアロフォンになりやすいことがわかります。 なお /∫/ のような標記は書きにくいので /sh/ などの記号で代用することも多いです。 鼻濁音 /ng/ は「私が行きます=わたし(が)いきます」の「が」のところで発音されるアロフォンです。鼻に抜ける音。 【講義ノート】サウンドスペクトログラム いずれ詳しく学びますが、音声やその構成要素である音素の音響的特性を観察する一つの手段として、サウンドスペクトログラムという表現法があります。 スペクトルの時間変化を3次元表示します。 横軸に時間、縦軸に周波数を配し、濃度で音響成分の強さ(パワー)を表現します。 周波数とかスペクトルとか次回以降勉強しますが、ここではとにかく、このサウンドスペクトログラムを使えば、音声を視覚的に表示できるということを知っておきましょう。 図の横軸が時間で、左から右の方に「条約」/zy oo j a k u/ という音声が表示されています。音素の違いがグラフィックの違いになっているのが分かります。 【講義ノート】音素の音響的特徴 日本語の音素には「母音」「子音」「半母音」の3種類があります。それぞれの音源と特徴を見ていきましょう。 まず母音、いえあおう、の音は、声帯音源、この喉のところにあるやつですね。 声帯音源で音を発生させます。「あー」というように長く延ばせますので、その音色を一定時間継続することができます。これを静的なスペクトルで特徴づけられるといいます。 音源は「声帯音源」 特徴は「スペクトル(静的)」 次に子音ですが、これは千差万別で、声帯音源も使うし、乱流音源、声道のせばめに強い息を通して雑音的な音を出す乱流音源も、両方使います。静的なスペクトルだけでなく、音色の変化に対応する動的なスペクトルも子音の特徴をつくります。 音源は「声帯音源(有声子音)、乱流音源」 特徴は「スペクトル、スペクトルの時間変化」 それから半母音です。これば母音と子音の特徴を併せ持っていて、音源は声帯音源だが、スペクトルは時間変化します。 音源は「声帯音源」 特徴は「スペクトルの時間変化」 【講義ノート】母音 母音は声帯を振動させて、定常的な繰り返し波形をつくります。声帯音源の音は高い周波数をたくさん含むブザーのような音ですが、声道の形を変化させて「共鳴」現象を起こし、 特定の高さの音成分を強調します。 この共鳴による音色の違いをつくるために、「舌(ゼツ)」と「顎(ガク)」の位置を組み合わせます。 例えば、自分の舌の位置を意識しながら、い、え、あ、お、う、と順に発声してみてください。舌のもりあがりの位置が、前から後ろに移動していくことがわかるでしょう。 この舌の位置を英語で「front」「back」、日本語ですと「前舌」「中舌」「後舌」ということばで表します。 図の front と back の間に「舌の位置」と書いておきましょう。 今度は、自分の顎の開きを意識しながら、い、え、あ、お、う、と順に発声してみてください。額がだんだん開いて、また閉じていくことがわかるでしょう。 この顎の位置を英語で「close」「open」、日本語で「狭」「半狭」「半広」「広」ということばで表します。 図の open と close の間に「顎の位置」と書いておきましょう。 このように、舌と顎の位置関係で、日本語の母音 /i/,/e/,/a/,/o/,/u/ が全て発声できます。 前に母音の種類を列挙したときに、何故か「あいうえお」ではなく「いえあおう」という順番に並べたのは、実はこの調音器官の位置の順序だったのです。 【講義ノート】母音(2) 気管から口までの「声道」の形を模式的に描いてみました。 母音 /i/ について「front close」母音、 母音 /a/ について「back open」母音、と呼ぶことがあります。 【講義ノート】子音 たくさんある子音の中で、無声破裂音、有声破裂音、鼻音の8種類に、アロフォン /ng/ を加えると、整然とした構造が現れます。 まず無声破裂音というのは /p/, /t/, /k/ の3つの子音です。声帯を震わせ「ない」状態で、声道のどこか、例えば口唇を閉じて閉鎖をつくり、そこに強い呼気圧をかけて「ぷっ」と破裂させます。これが無声破裂音 /p/ です。 試しに、唇を閉じずに「ぷ」と言おうとしてみてください。絶対言えませんね。閉鎖と破裂が音素 /p/ の本質なのです。 前歯の裏側、歯茎に舌先をあてて閉鎖をつくり、破裂させるのが /t/。 口と鼻を分離すの「軟口蓋」に舌の後端をあてて閉鎖をつくり、破裂させると /k/ の音が出せます。 閉鎖をつくる位置を「調音位置」といいます。「調音位置の違い」によって、子音の音色が変わるのです。3つの調音位置を、それぞれ「口唇」「歯茎」「軟口蓋」と呼んでいます。 図の ← と → の間に「調音位置の違い」と書いておきましょう。 さて、これら3つの無声破裂音は破裂の起きた時点では声帯が振動していません。だから「無声」破裂音といいます。 同じように、有声破裂音 /b/, /d/, /g/ にも3つの調音位置が対応します。これらは /p/, /t/, /k/ とよく似ているのですが、破裂の前に声帯を振動させます。よって「有声」破裂音といいます。 さらに鼻音です。/m/, /n/, /ng/ は、軟口蓋を下げて鼻からも音を放射します。いわゆる鼻声です。各々3つの調音位置が対応します。 図の ↑ と ↓ の間に「調音様式の違い」と書いておきましょう。 【講義ノート】子音(2) 摩擦音は、声道のせばめにより乱流(雑音)を起こして発声します。この雑音成分に声帯音源の音を重ねて発生するのが、有声摩擦音 /z/ です。ざじずぜぞ。 声帯を震わせない場合が、無声摩擦音 /s/ になります。さしすせそ。 声道のせばめにより乱流(雑音音源)を作る とメモしておきましょう。 破擦音 /c/ は摩擦に破裂を重ねたものです。「ち」とか「つ」の音です。 摩擦+破裂 とメモしておきましょう。 気音 /h/ は、無声摩擦音 /s/ とよく似ていますが、声道のせばめを弱くし雑音成分を少なくした音です。はひふへほ。 声道のせばめ弱い とメモしておきましょう。 【講義ノート】子音(3) 流音 /r/ は、舌を左右にまるめて、左右より音を通す子音です。横から音を通すので側音と呼ぶこともあります。らりるれろ。 舌を左右にまるめて、左右より音を通す とメモしておきましょう。 撥音 /N/ は口腔を閉じて鼻腔のみから音声を放射します。「ん」です。 口腔を閉じて鼻腔のみから音声を放射 とメモしておきましょう。 【講義ノート】半母音・拗音 半母音 /w/ は、母音が /o/→/a/ と変化することで発声されます。 /o/→→→/a/, /o/→→/a/ /o/→/a/ とだんだん速くすると /w/ になる。「わ」。 /o/→/a/ という変化 とメモしておきましょう。 半母音 /j(ヨット)/ は、母音 /i/ から他の母音への速い変化で発声します。 /j a/, /j u/, /j o/。「や」「ゆ」「よ」。 /j a/, /j u/, /j o/ とメモしておきましょう。 子音と半母音を組み合わせて「拗音」を発声します。「きゃ」「きゅ」「きょ」など。 きゃ、きゅ、きょ など とメモしておきましょう。 --