音响期末复习
音波は空気の振動(圧力と密度の変化)により波として伝えられるもの
- 正弦波で表現される
音圧は 音による圧力の変化
- Pa(パスカル) N/m
- 音圧は距離の2乗に反比例
- 音圧は振幅を2乗してから平均を取りその平方根を算出
周波数は音波において単位時間(1秒)に繰り返される正弦波の数
- Hz
波長λは音速c / 周波数fの関係
周波数fの逆数が周期T
波の振幅(強さ)
波の位相(時間的なずれ)
球面波:音波が空間的に同心円状に広がる波の様子
- 音圧は距離と共に減衰
平面波:波の形を変えず1つの方向に進行していく波の様子
無指向性音源: 音源を中心にあらゆる方向に一様に音波を放射する音源
指向性音源: 方向によって音圧が異なる音源
音波の回折: 音の回り込み現象
- 音波の波頭のあらゆる点はすべて点音源として全方向に音波を生成するため生じる
音の共振
- 特定の周波数で振動する現象
- そのときの周波数が共振周波数
音圧レベルは人間が音圧差を感知しやすいように音圧を対数表記したもの
- 音圧レベル(SPL: Sound Pressure Level [dB])
騒音を30dB以上抑圧するということは、騒音を99.9%以上抑圧することと等しい。 騒音を20dB以上抑圧するということは、騒音を99%以上抑圧することと等しい。 騒音を10dB以上抑圧するということは、騒音を90%以上抑圧することと等しい。
正弦波(sin)の定義
- 半径rの円周上を一定の速度で回転する点の動きをy軸に投影した波形
- 1秒で円を1周すれば1Hz, 5周すれば5Hz
- 1つの正弦波による音を純音(pure tone)という
フーリエ級数展開により表現可能
- すべての周期信号はsinとcosの和
- よって音を周期信号と見立てれば、音はすべてsinとcosで表現可能
音の表現力を増強させる考え方が音のスペクトルとなる
スペクトルとは
- 時間軸の信号を周波数軸で表現したもの
- 特殊な変換を除き、基本的にはスペクトルは複素数で表現
- フーリエ変換も複素数で表現
音のスペクトルとは
- 音の波形を各周波数ごとに表現したもの
- 複素数で表現するため、各周波数における振幅と位相を独立して表現可能周波数における振幅の表現方法
パワー(振幅)スペクトル
- スペクトルのパワー(振幅)を示す。音信号では対象周波数の大きさを示す。パワーは振幅の2乗で表現できる周波数における位相の表現方法
位相スペクトル
- スペクトルの進度を示す。基準信号に対する対象周波数の位相を表し、「遅れている」とか「進んでいる」と表現する。
雑音は周期性のない不規則な波形を持つ信号
- 不規則=様々な周波数成分を含む
- 白色雑音(white noise)
- 帯域雑音
フィルタ
- 特定の周波数成分だけを通過する回路
- 低域通過フィルタ、高域通過フィルタ
- 帯域通過フィルタ、帯域阻止フィルタ
音のスペクトル
- ある区間における周波数特性
- 横軸:周波数、縦軸:振幅(パワー)
音のスペクトログラム
- ある区間における周波数特性を時系列ごとに並べたもの
- 横軸:時間、縦軸:周波数、色:各時刻・各周波数の振幅(パワー)
反射: 音が壁などに当たって跳ね返る(反射する)現象
- 特に低次の反射もしくは直接音と相関の強い反射のことを反射音と呼ぶ
残響: 反射が多重に重なりあう現象
- 特に超高次の反射もしくは直接音と相関の弱い反射のことを残響と呼ぶ
音線法(レイトレーシング): 音の伝わり方を線で表す方法
インパルス応答
- 音源からインパルスを放射したときの受音信号
- 音の場合
- 最初に直接音
- 続いて初期反射音(室内なら10ms以内)
- さらに続いて高次の反射音(その後、残響)
インパルス信号
- エネルギーが小さいので、Time Streached PulseやM系列信号など雑音に頑健な信号を使ってインパルス応答を計測するのが一般的である。
- 全周波数が均一に含まれている。
- 時刻0でのみ振幅1を持つ信号である。
- インパルス信号を積分すると1である。
インパルス応答
- 計測にはマイクロホン(もしくはセンサー)が必要である。
- 部屋の反射や残響の特性が含まれている。
- 必ず時間の経過と共に減衰
伝達関数計測時の耐雑音対策: TSP(Time Stretched Pulse)
実計測ができる場合: インパルス応答(impulseresponse)
実計測ができない場合: 音線法
TSP信号と逆TSP信号を畳み込むと1になる。
音源とインパルス応答の畳み込み和で表現できる音: 点音源
残響時間とは音のエネルギーが60dB減衰するまでの時間である。
インパルス応答を2乗積分して求めた残響曲線から算出できる。
残響時間とは音のエネルギーが100万分の1になるまでの時間である。
室容積が大きくなると残響時間も長くなる。
周波数ごとに残響時間を考えると、高域よりも低域のほうが残響時間は長い。
音楽の受聴には残響時間が1.5-3sくらいが適切である。
聴覚は主に背後の環境把握
外耳:耳介と外耳道
- 耳介は到来音波を回折
- 外耳道は鼓膜を終端とした管
- 鼓膜が内耳との境界
中耳:大部分が骨(聴小骨)
内耳:蝸牛と三半規管
- 蝸牛:聴覚神経への入口で振動の知覚を担う
- 音の高さ/低さの知覚も蝸牛が担当
- 三半規管:平衡感覚
空気中の音⇒耳介⇒外耳道⇒鼓膜⇒聴小骨⇒蝸牛⇒聴神経系を刺激
音の大きさ( Loudness ) 音の高さ( Pitch ) 音質(音色) ( Sound quality )
音として感じる音圧
- 下限は0dB, 上限は120dB程度が限界
音として感じる周波数
- 20Hz ~20kHz (10オクターブ程度)
最高可聴周波数域
- 個人差はあるが、年齢と共に最高可聴周波数域は低下
- 男性よりも女性のほうが可聴域は広く
両耳による受聴
- 振幅差(レベル差)
- 位相差(時間差)
- 音色差
音源定位, 音像定位
- 音像定位はオーディオ再生にとって極めて重要
先行効果 (ハース効果): 2音同時受聴において、先に耳に到来した音に音像が引っ張られる現象
- 遅延が1-30ms:音像は先行音に強く影響
- 遅延が50ms以上:2つの音が分離し、遅れた音はエコーとして聴こえる
聴覚は音波の時間的変化を感知するための感覚器の1つである。不是空间
聴覚は3-3.5kHzくらいが最も感度が良い。
人間の聴覚は、同じ音の強さでも周波数によって感じる音の大きさは異なる。
聴覚の感度は外耳道の長さと大きさの影響を受けている。
カクテルパーティ効果
- 音源の位置や音源ごとに異なる声の基本周波数の差を利用して聞き分けている。
- 小さい音でも興味のある信号を選択的に聞き分けることができる。
- 複数の音から特定の音を聞き取る能力である。
ダイナミック(動電形)マイクロホン
コンデンサ(静電形)マイクロホン
- 全指向性 … 録音用マイク
- 単一指向性 …コンサート、カラオケ用
- 超指向性 …ガンマイクなど
- 双指向性 …対談用マイク
増幅器(アンプ)
ミキサーは音の混合をリアルタイムで行う機器である。
デジタルミキサーはDSPを内蔵しているため、信号処理や畳み込みなどもリアルタイムで行える。
アナログミキサーはデジタルミキサーよりも音の遅延が少ない。
アンバランス系はホット、アースの2極にて伝送するため、雑音に弱く5mくらいまでしか正しく伝送できない。
バランス系はホット、コールド、アースの3極にて伝送するため、雑音に強い。
RCAプラグは主にアンバランス系で使われる。
受信側では、コールドの音信号を位相反転しホットの音信号と足し合わせることで、伝送時に混入した雑音を相殺する。
バランス系の伝送ケーブルを踏むと、ホットおよびコールドにて伝送している音信号に対して同振幅、同位相で雑音が混入する。
送信側にて、ホットで音信号の正位相、コールドで音信号の逆位相を伝送する。
伝送プラグ/ケーブル
- バランス系(キャノンXLRなど)
- 業務用
- ホット、コールド、アースの3極
- 雑音に強い ⇒ 延長してもOK
- アンバランス系(標準(フォン)プラグ、ミニプラグ)
- 一般家庭用
- ホット、アースの2極
- 雑音に弱い
- 延長する前に必ず増幅が必要
- 5m以上延長するときは必ず増幅
AD変換(コンバータ): 品質は量子化ビット数と標本化周波数に依存
一般的な音楽CD
- 標本化周波数: 44100Hz
- 1秒間に44100回デジタル化
- 量子化ビット数: 16bit
- 各時刻の値を2byte=16bit(-32768~32767)で表現
- チャンネル数: 2ch(L,R)
MPEGは聴覚マスキング特性を利用した圧縮技術
実際の音信号を離散フーリエ変換する際に高精度スペクト ルを求めるために最も注意すべき点は何か? 解答例 不連続点の除去 有限長の信号を無限長に仮定して変換するので、必ず始点と終点で 不連続点が発生。窓関数などで不連続点を除去しないと、パルス性 の雑音が発生し、高精度なスペクトルを得ることができない
高域信号は低域信号に比べて空気中での減衰量が大きい。 よって、先に高域信号を計測してから低域信号を計測すれ ば、お互いが干渉すること可能性が小さい。 逆に低域信号を計測してから高域信号を計測すると、低域 信号がなかなか減衰せず、高域信号の計測中にも影響を 及ぼす可能性があるため、高域信号の計測品質が低下す る可能性あり
非線形で時変な系は畳み込みでは表現不能 たとえば、移動音。時間とともに系の特性は変化。 そのほかには、面音源。ス