先の序文で少し話に出たが、
空気の振動の波としての音を、物理的に解明する学問分野に、
音響音声学(acoustic phonetics)がある。
空気中を伝わる波は、
呼気によって作られた空気の圧縮と希薄からなる。
圧縮と希薄の繰り返しが多く生じれば、声は高く、
少なければ低い声が出る。
これを周波数(frequency)といい、
1秒間に、圧縮と希薄のセットが何回繰り返されるかを単位とし、
ヘルツ(Hz)またはc/sと表記する。
一般的に男性の発声は100Hz〜300Hz、女性は200Hz〜400Hzと言われている。
また、どれだけ強く圧縮するかは、振幅(amplitude)といい、
これによって声の多きさが変化する。
圧縮、希薄の度合いが大きいほど声は大きく、小さい声はその度合いが弱い。
これにはエネルギーとして単位、デシベル(dB)を用いる。
普通の会話は60dB付近と言われている。
数値の求め方やその他の音の大きさは、下の参考HPをどうぞ。
音声を発するときには、
肺からの呼気を、調音器官で様々に変容させる。
唇や舌を使って空気の流れを阻害したりする。
特に子音は阻害の度合いが甚だしく、窓のすきま風のような音を生じる。
母音や鼻音は、咽頭や口、鼻の大きな空洞を利用し、共鳴させる。
この仕組みはパイプオルガンやバイオリンに似ており、
さまざまな周波数の音が、さまざまな強さで出る事によって、
音声の区別や、声色の個人差を生じさせている。
この、どの周波数の音が大きく響くかを、フォルマント(formant)という。
個人差はあれども、同じ母音ならば同じような数値になる。
母音の区別はこのフォルマントの位置にあると言える。
フォルマントは、口やのどの形から、モデルを計算することができるが、
現在ではこのような分析のための数値や音声の波は、
コンピュータソフトで簡単にみる事ができる。
音声分析を通してわかる事は、人間の脳みその複雑さである。
なぜこんなに違う音を、同じ「あ」だと認識できるのか。
同じ人間が発音しても、毎回毎回、周波数やフォルマントは異なる。
この雑多な波を処理し意味を認識するために、
今は最前線で、自動翻訳機などにおける音声認識の研究が進んでいる。
参考文献
M. シュービゲル著 小泉保訳 『新版 音声学入門』 大修館書店 1973
音的生活47号『「デシベル」とは』 http://www.soundzone.jp/ototeki/oto47.html
空気の振動の波としての音を、物理的に解明する学問分野に、
音響音声学(acoustic phonetics)がある。
空気中を伝わる波は、
呼気によって作られた空気の圧縮と希薄からなる。
圧縮と希薄の繰り返しが多く生じれば、声は高く、
少なければ低い声が出る。
これを周波数(frequency)といい、
1秒間に、圧縮と希薄のセットが何回繰り返されるかを単位とし、
ヘルツ(Hz)またはc/sと表記する。
一般的に男性の発声は100Hz〜300Hz、女性は200Hz〜400Hzと言われている。
また、どれだけ強く圧縮するかは、振幅(amplitude)といい、
これによって声の多きさが変化する。
圧縮、希薄の度合いが大きいほど声は大きく、小さい声はその度合いが弱い。
これにはエネルギーとして単位、デシベル(dB)を用いる。
普通の会話は60dB付近と言われている。
数値の求め方やその他の音の大きさは、下の参考HPをどうぞ。
音声を発するときには、
肺からの呼気を、調音器官で様々に変容させる。
唇や舌を使って空気の流れを阻害したりする。
特に子音は阻害の度合いが甚だしく、窓のすきま風のような音を生じる。
母音や鼻音は、咽頭や口、鼻の大きな空洞を利用し、共鳴させる。
この仕組みはパイプオルガンやバイオリンに似ており、
さまざまな周波数の音が、さまざまな強さで出る事によって、
音声の区別や、声色の個人差を生じさせている。
この、どの周波数の音が大きく響くかを、フォルマント(formant)という。
個人差はあれども、同じ母音ならば同じような数値になる。
母音の区別はこのフォルマントの位置にあると言える。
フォルマントは、口やのどの形から、モデルを計算することができるが、
現在ではこのような分析のための数値や音声の波は、
コンピュータソフトで簡単にみる事ができる。
音声分析を通してわかる事は、人間の脳みその複雑さである。
なぜこんなに違う音を、同じ「あ」だと認識できるのか。
同じ人間が発音しても、毎回毎回、周波数やフォルマントは異なる。
この雑多な波を処理し意味を認識するために、
今は最前線で、自動翻訳機などにおける音声認識の研究が進んでいる。
参考文献
M. シュービゲル著 小泉保訳 『新版 音声学入門』 大修館書店 1973
音的生活47号『「デシベル」とは』 http://www.soundzone.jp/ototeki/oto47.html
PR
なんだか音声学のカテゴリーは
話題が統一されていないような気がするのですが、
まあ気にせず続けます。
今回は文節間のアクセント推移の簡単な話。
文節間のアクセントは、簡単に言うと譲り合い。
アクセントのない平板型または0型を、無核とも言うが、
前部要素と後部要素が両方無核であれば、結果も無核となる。
ムズカシイ+モンダイ=ムズカシイモンダイ
前部要素と後部要素のどちらかが無核で、もう一方が有核である場合は、
有核のアクセントが優先される。
ワタシガ+ワ^ルカッタ=ワタシガワ^ルカッタ
ユック^リ+ススメル=ユック^リススメル
両方がアクセント核を持った分節である場合は、前部要素を優先させる。
タカ^イ+ヤマ^ガ=タカ^イヤマガ
この法則は、前回紹介したような、
分節内のアクセント推移が全て適用された後に、適用される。
しかし現実の現象はモデルとは異なり、
副次アクセントと呼ばれるものも存在する。
「タカ^イヤマガ」は弱いアクセントを「マ」に残して発音される。
文節間でも、副詞を多く含む句のアクセント推移は、
長い複合語や、付属語が多い分節などと同じように、
予測不可能なアクセントが出現する確立が高くなる。
参考文献
匂坂芳典、佐藤大和「テキストからの音声合成を目的とした日本語アクセント結合規則」(1983)
話題が統一されていないような気がするのですが、
まあ気にせず続けます。
今回は文節間のアクセント推移の簡単な話。
文節間のアクセントは、簡単に言うと譲り合い。
アクセントのない平板型または0型を、無核とも言うが、
前部要素と後部要素が両方無核であれば、結果も無核となる。
ムズカシイ+モンダイ=ムズカシイモンダイ
前部要素と後部要素のどちらかが無核で、もう一方が有核である場合は、
有核のアクセントが優先される。
ワタシガ+ワ^ルカッタ=ワタシガワ^ルカッタ
ユック^リ+ススメル=ユック^リススメル
両方がアクセント核を持った分節である場合は、前部要素を優先させる。
タカ^イ+ヤマ^ガ=タカ^イヤマガ
この法則は、前回紹介したような、
分節内のアクセント推移が全て適用された後に、適用される。
しかし現実の現象はモデルとは異なり、
副次アクセントと呼ばれるものも存在する。
「タカ^イヤマガ」は弱いアクセントを「マ」に残して発音される。
文節間でも、副詞を多く含む句のアクセント推移は、
長い複合語や、付属語が多い分節などと同じように、
予測不可能なアクセントが出現する確立が高くなる。
参考文献
匂坂芳典、佐藤大和「テキストからの音声合成を目的とした日本語アクセント結合規則」(1983)
韻律(prosody)とは、
詩の形式だけをさすのではなく、
日常会話の音声の形式を広く指す言葉である。
子音、母音以外の音律には以下のような種類がある。
高さ:アクセント、イントネーション(周波数)
速さ:リズム、タイミング、テンポ(時間)
強さ:ストレス、ラウドネス(振幅、エネルギー)
高さ、速さ、強さは実際の知覚であり、
括弧内は物理的な音声としての韻律の要素、要因である。
日本語はアクセントによる韻律を作り、
英語はストレスによる韻律が作られる事は、以前の述べた通りである。
タイミングに関しては、
日本語はモーラ・タイミングであるのに対し、
英語はストレス・タイミングである事が知られている。
日本語は拍ごとに、一定のテンポでマシンガンのように発話する。
これを等拍性(mora isochrong)と言う。
一方英語は単語を越えた超文節的なストレスとストレスの間、
ISI(Inter Stress Interval)が一定のリズムになるように、
機能語と呼ばれるような"in"や"the"の発音が極端に短くなる言語である。
参考文献
斉藤純男 『日本語音声学入門 改訂版』 三省堂 2008
詩の形式だけをさすのではなく、
日常会話の音声の形式を広く指す言葉である。
子音、母音以外の音律には以下のような種類がある。
高さ:アクセント、イントネーション(周波数)
速さ:リズム、タイミング、テンポ(時間)
強さ:ストレス、ラウドネス(振幅、エネルギー)
高さ、速さ、強さは実際の知覚であり、
括弧内は物理的な音声としての韻律の要素、要因である。
日本語はアクセントによる韻律を作り、
英語はストレスによる韻律が作られる事は、以前の述べた通りである。
タイミングに関しては、
日本語はモーラ・タイミングであるのに対し、
英語はストレス・タイミングである事が知られている。
日本語は拍ごとに、一定のテンポでマシンガンのように発話する。
これを等拍性(mora isochrong)と言う。
一方英語は単語を越えた超文節的なストレスとストレスの間、
ISI(Inter Stress Interval)が一定のリズムになるように、
機能語と呼ばれるような"in"や"the"の発音が極端に短くなる言語である。
参考文献
斉藤純男 『日本語音声学入門 改訂版』 三省堂 2008
日本語のテンポはモーラによって一定だと言ったが、
実際は決して統一されているなどとは言えない。
具体的に、日本語のテンポが変化する要因がある。
以下は単音、音韻、語、句、文の分節ごとに調査した結果である。
調査は、文字化された文の音読記録の分析である。
表記には中途半端な音韻記号を用いた。自覚はある。
単音(phoneme)
一般的に高母音は短く、低母音は長く発音される。
[ a ],[ e ],[ o ]が約100〜120ms(ミリセカンド、1000分の1秒)なのに対し
[ i ],[ u ]は約80msと、特に短い。
低母音は口を大きく開ける為、とも言われるが定かではない。
子音では一般的に、無声音が長く、有声音が短い。
また、摩擦音が長く、たたき音が短い。
[ sh ]が100msに近いのに対し、[ dz ]は約50msである。
また、[ r ]は20ms程しかない。
音韻(phonemes)
子音によって後続する母音の長さが変わるかと言う調査では、
母音の長さと子音の長さは反比例する事がわかった。
平均的には、C+Vのセットがほぼ同じ長さで発音される。
しかし、先行する母音と子音の関係でも、微かながら反比例の形式となる為、
C+Vの関係だけでは十分に説明出来ない。
息継ぎや間(pause)の様式は、1モーラもしくは3モーラがずば抜けて多い。
これは実験のサンプル、がアナウンサーなどプロの話し手から取っており、
アナウンサーの教養として、そのような教育がなされている事に起因するとされる。
語(word)
日本語には、英語のように機能語を短く発音する習慣がなく、
単語レベルのテンポの調節はないとされてきた。
しかし、実際にはかってみると、自立語にはあまり差異が見られなかったものの、
やはり、付属語は短く発音される傾向がある事がわかった。
と言っても、5ms程の差である。
しかし、強調の語尾や感嘆詞、並列助詞(と、や)、係助詞(は)は長く発音される。
強調の意を込めて長く発音されていると考えられる。
句(phrase)
息継ぎをせず、何モーラも話し続ければ、それだけ速くなると思われるが、
実際は、モーラ数が少ない程遅く、多いと1モーラ当たり約110msで一定となる。
一度に話す語が少なければ少ない程、いろんな速さで発話出来るが、
5モーラ以下では、平均的には約200ms、
5〜10モーラでは100〜150msでの発話が多い。
15モーラ以上になると、110msの速度で一定となる。
また、「○○がー、□□してー、それでー」などの話し方からも特徴的なように、
句末の拍は15〜20msほど長く発音される。
文(sentence)
句末とは逆に、文末は最後の一拍が短い。
「です」「だった」「である」がの最後が、50msも短く発音された。
若者言葉のネイティブとしては、
この結果にはバイアスがかかっているのでは?と思わざるを得ない。
さらに、文末の最後の3拍程で、特に、
声が小さくなると言う、ラウドネスの変化が顕著に見られた。
参考文献
匂坂芳典「Modeling and perception of temporal characteristics in speech」(2003)
実際は決して統一されているなどとは言えない。
具体的に、日本語のテンポが変化する要因がある。
以下は単音、音韻、語、句、文の分節ごとに調査した結果である。
調査は、文字化された文の音読記録の分析である。
表記には中途半端な音韻記号を用いた。自覚はある。
単音(phoneme)
一般的に高母音は短く、低母音は長く発音される。
[ a ],[ e ],[ o ]が約100〜120ms(ミリセカンド、1000分の1秒)なのに対し
[ i ],[ u ]は約80msと、特に短い。
低母音は口を大きく開ける為、とも言われるが定かではない。
子音では一般的に、無声音が長く、有声音が短い。
また、摩擦音が長く、たたき音が短い。
[ sh ]が100msに近いのに対し、[ dz ]は約50msである。
また、[ r ]は20ms程しかない。
音韻(phonemes)
子音によって後続する母音の長さが変わるかと言う調査では、
母音の長さと子音の長さは反比例する事がわかった。
平均的には、C+Vのセットがほぼ同じ長さで発音される。
しかし、先行する母音と子音の関係でも、微かながら反比例の形式となる為、
C+Vの関係だけでは十分に説明出来ない。
息継ぎや間(pause)の様式は、1モーラもしくは3モーラがずば抜けて多い。
これは実験のサンプル、がアナウンサーなどプロの話し手から取っており、
アナウンサーの教養として、そのような教育がなされている事に起因するとされる。
語(word)
日本語には、英語のように機能語を短く発音する習慣がなく、
単語レベルのテンポの調節はないとされてきた。
しかし、実際にはかってみると、自立語にはあまり差異が見られなかったものの、
やはり、付属語は短く発音される傾向がある事がわかった。
と言っても、5ms程の差である。
しかし、強調の語尾や感嘆詞、並列助詞(と、や)、係助詞(は)は長く発音される。
強調の意を込めて長く発音されていると考えられる。
句(phrase)
息継ぎをせず、何モーラも話し続ければ、それだけ速くなると思われるが、
実際は、モーラ数が少ない程遅く、多いと1モーラ当たり約110msで一定となる。
一度に話す語が少なければ少ない程、いろんな速さで発話出来るが、
5モーラ以下では、平均的には約200ms、
5〜10モーラでは100〜150msでの発話が多い。
15モーラ以上になると、110msの速度で一定となる。
また、「○○がー、□□してー、それでー」などの話し方からも特徴的なように、
句末の拍は15〜20msほど長く発音される。
文(sentence)
句末とは逆に、文末は最後の一拍が短い。
「です」「だった」「である」がの最後が、50msも短く発音された。
若者言葉のネイティブとしては、
この結果にはバイアスがかかっているのでは?と思わざるを得ない。
さらに、文末の最後の3拍程で、特に、
声が小さくなると言う、ラウドネスの変化が顕著に見られた。
参考文献
匂坂芳典「Modeling and perception of temporal characteristics in speech」(2003)
日本語のテンポでは、日本語の発音の時間に関してのべたが、
今回はそれをどう知覚しているかと言う視点での調査結果を述べる。
テンポに関しては、JND(Just Noticeable Difference)という実験方法がある。
複数のサンプルから取ったモデル値から、
音韻長を伸ばしたり縮めたりした加工音声を被験者に聞かせ、
自然か不自然かを判断してもらう方法である。
一般的には10~15msの間で行われる。
この実験で、結果報告の前に典型的な質問がある。
Q. / a /のモデル値は120ms、/ i /のモデル値は80msである。
文章のなかで、/ a /と/ i /、それぞれから40msずつ引いて被験者に聞かせると、どちらがより不自然であるか。
つまり、80msの/ a /と、40msの/ i /の、どちらが違和感が強いか、という質問である。
切り取られた時間は同じなので、科学的に考えると、この二つには誤差なし、となる。
さて、答えを言う前に、いくつかの実験結果を述べてゆく。
ある単語のひとつの音韻を引き延ばしたり、縮めたりした語をいくつも聞かせ、
自然さ(naturalness)を点数で評価してもらう実験の結果である。
1、「harahara(ハラハラ)」と「gakureki(学歴)」の/ a /を同様に伸縮させると、
「gakureki』の方が自然性のが減少幅が大きかった。
2、「sashidasu(差し出す)」と「barabara(バラバラ)」の/ a /を伸縮させると、
「barabara」の方が自然性の減少幅が大きかった。
3、「iriguchi(入り口)」と「sakasama(逆さま)」の/ i /と/ a /を伸縮させると、
「sakasama」の方が自然性の減少幅が大きかった。
A.80msの/ a /の方が、40msの/ i /より不自然である。
これは、テンポだけではなく、音声のエネルギー量である、ラウドネス(loudness)に関係すると考えられる。
/ a /は/ i /よりも呼気の阻害が少なく、口を大きく開けて発音する。
切り取られた4ms分の/ a /のエネルギーが、40ms分の/ i /のエネルギーより多いので、より不自然に知覚される。
同じ、/ a /でも、「harahara」と「gakuen」、「sashidasu」と「barabara』の自然性に差があったのは、挟まれる子音のラウドネスと関係があると考えられる。
聞こえ音階層(05/27)で説明したように、
摩擦音よりはじき音の方が、無声音より有声音の方が、ラウドネスが大きい。
つまり、/ sash /において/ a /の音韻長が減ると、
ただでさえラウドネスの較差が大きいのでより違和感が強調され、
/ bar /において/a /の音韻長が減っても、
先行する/ b /や/ r /で補う事が出来るので、違和感が中和されるのである。
参考文献
匂坂芳典「Modeling and perception of temporal characteristics in speech」(2003)
今回はそれをどう知覚しているかと言う視点での調査結果を述べる。
テンポに関しては、JND(Just Noticeable Difference)という実験方法がある。
複数のサンプルから取ったモデル値から、
音韻長を伸ばしたり縮めたりした加工音声を被験者に聞かせ、
自然か不自然かを判断してもらう方法である。
一般的には10~15msの間で行われる。
この実験で、結果報告の前に典型的な質問がある。
Q. / a /のモデル値は120ms、/ i /のモデル値は80msである。
文章のなかで、/ a /と/ i /、それぞれから40msずつ引いて被験者に聞かせると、どちらがより不自然であるか。
つまり、80msの/ a /と、40msの/ i /の、どちらが違和感が強いか、という質問である。
切り取られた時間は同じなので、科学的に考えると、この二つには誤差なし、となる。
さて、答えを言う前に、いくつかの実験結果を述べてゆく。
ある単語のひとつの音韻を引き延ばしたり、縮めたりした語をいくつも聞かせ、
自然さ(naturalness)を点数で評価してもらう実験の結果である。
1、「harahara(ハラハラ)」と「gakureki(学歴)」の/ a /を同様に伸縮させると、
「gakureki』の方が自然性のが減少幅が大きかった。
2、「sashidasu(差し出す)」と「barabara(バラバラ)」の/ a /を伸縮させると、
「barabara」の方が自然性の減少幅が大きかった。
3、「iriguchi(入り口)」と「sakasama(逆さま)」の/ i /と/ a /を伸縮させると、
「sakasama」の方が自然性の減少幅が大きかった。
A.80msの/ a /の方が、40msの/ i /より不自然である。
これは、テンポだけではなく、音声のエネルギー量である、ラウドネス(loudness)に関係すると考えられる。
/ a /は/ i /よりも呼気の阻害が少なく、口を大きく開けて発音する。
切り取られた4ms分の/ a /のエネルギーが、40ms分の/ i /のエネルギーより多いので、より不自然に知覚される。
同じ、/ a /でも、「harahara」と「gakuen」、「sashidasu」と「barabara』の自然性に差があったのは、挟まれる子音のラウドネスと関係があると考えられる。
聞こえ音階層(05/27)で説明したように、
摩擦音よりはじき音の方が、無声音より有声音の方が、ラウドネスが大きい。
つまり、/ sash /において/ a /の音韻長が減ると、
ただでさえラウドネスの較差が大きいのでより違和感が強調され、
/ bar /において/a /の音韻長が減っても、
先行する/ b /や/ r /で補う事が出来るので、違和感が中和されるのである。
参考文献
匂坂芳典「Modeling and perception of temporal characteristics in speech」(2003)
言語学が大好きな一般人のブログです。
過去の記事は、軌跡として残しておきます。
カレンダー
04 | 2025/05 | 06 |
S | M | T | W | T | F | S |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
ブログ内検索
カテゴリー
最新記事
(10/02)
(09/30)
(09/29)
(09/26)
(09/25)
プロフィール
HN:
てぬ
性別:
女性
自己紹介:
大学院で言語学を学びたい大学生が、日々の勉強の成果を記録してゆく為の、個人サイトでした。
最新トラックバック
最古記事
(01/01)
(04/07)
(04/08)
(04/09)
(04/09)
P R