PAREMPIA BINAURAALISIA ÄÄNITYKSIÄ TOSIPÄÄLLÄ?

Panu Maijala
Teknillinen korkeakoulu
Akustiikan ja äänenkäsittelytekniikan laboratorio
PL 3000, 02015 TKK
FirstName.LastName@iki.fi
http://iki.fi/pantse

1 JOHDANTO

Useimmat binauraaliset äänitykset tehdään tänä päivänä keinopäällä, joka on kopio keskimääräisestä ihmispäästä niin mitoiltaan kuin yksityiskohdiltaankin. Usein niiden pintamateriaali jäljittelee luun kovuutta ja ihon pehmeyttä. Joillakin äänitykseen käytettävillä päillä on lisäksi olkapäät ja jopa hiuksia on käytetty sillä kaikilla näillä yksityiskohdilla on vaikutus ääneen.
Binauraalinen tekniikka [1] perustuu käsitykseen, jonka mukaan äänipainesignaalit kummallakin tärykalvolla määräävät kuuloaistimuksen. Tallennettu äänimaisema on sen mukaan täysin toistettavissa, mikäli äänipaineet toistetaan täsmälleen samanlaisina kuulijan tärykalvoilla. Kuitenkin kuuloalueen yläpäässä jopa parhaimmat keinopäät eroavat suodatusominaisuuksiltaan huomattavasti useimpien ihmisten päistä.
Lokalisointi keinopää-äänitteillä tiedetään melko huonoksi kun taas koehenkilöiden omilla päillä tehdyillä äänitteillä on saatu huomattavasti parempia tuloksia [5]. Koehenkilön päällä tehdystä äänittämisestä on vakiintumassa suomen kieleen termi tosipää-äänitystekniikka (real head recording). Tutkittaessa melunlaatua työkoneissa, tämä on ainut vaihtoehto kun koneella halutaan samanaikaisesti työskennellä. Vain harvat koneet ovat niin pitkälle automatisoituja, että ohjaamoon voisi istuttaa keinopään ja antaa mennä. Useimmin näin pitkälle automatisoiduissa koneissa ei ole edes ohjaamoa. Paras tilanne saavutetaan, kun äänitetään koneen käyttäjän päällä samanaikaisesti ja äänitys ei vaikuta mitenkään koneen toimintaan.
Tässä työssä tehtävänä oli evaluoida äänen laatua työkoneen ohjaamossa. Tutkimme useita traktoreita ja lastaajia äänittämällä koneen ääntä sekä keinopäällä että koehenkilön päällä. Tosipäällä äänitetyt näytteet olivat huomattavasti todentuntuisemmat kuin keinopäällä äänitetyt. Tämän vuoksi päätimme tutkia kuuntelukokeilla, ovatko satunnaisesti valitun koehenkilön päällä äänitetyt näytteet aina parempia kuin korkealaatuisella keinopäällä äänitetyt näytteet.

2 TOSIPÄÄ-ÄÄNITYSLAITTEISTO

Suunnittelimme käyttöömme soveltuvan kannettavan tosipää-äänityslaitteiston, joka koostuu pienestä paristolla toimivasta etuvahvistimesta (kuva 1) ja DAT -nauhurista. Etuvahvistin suunniteltiin käyttäen vähäkohinaista yksipuoleisella käyttöjännitteellä toimivaa operaatiovahvistinta SSM-2135S. Mikrofoneina käytimme Sennheiserin kondensaattoripainemikrofoneja (KE-4-211-2) E-A-R korvatulppien kanssa (kuva 2). Ääni tallennettiin suljetun korvakäytävän suulta, missä mikrofonit pysyvät hyvin paikoillaan korvan taakse menevän sangan ansiosta (kuva 3 ja kuva 4). Mikrofonikapselin ja etuvahvistimen vapaakenttävaste todettiin riittävän hyväksi (100 Hz - 20 kHz ±1dB).


Kuva 1. Etuvahvistin Kuva 2. Mikrofonikapseli ja E-A-R

2.1 Binauraalisen äänittämisen teoriaa

Ihmisen korvakäytävä on keskimäärin 8 mm halkaisijaltaan ja 25 mm pituudeltaan. Äänen etenemistä korvakäytävän suulta tärykalvolle voidaan pitää korvakäytävän suulle tulevan äänen suunnasta riippumattomana [6]. Jotkut keinopäävalmistajat ovat sijoittaneet mikrofonit samoihin paikkoihin kuin tärykalvot. Tällöin täytyy käyttää lisäksi erityistä korjaussuodinta poistamaan äänen etenemisestä kaksi kertaa korvakäytävän läpi syntyvä virhe (ensin äänitettäessä ja toisen kerran toistettaessa). Ääni voidaan tallentaa myös korvakäytävän suulta [1]. Todistus on johdettu myös suljetulle korvakäytävälle, mikä on paljon käytännöllisempää kuin läheltä tärykalvoa [2] [3]. Mikrofoni voidaan sijoittaa jopa muutaman millimetrin korvakäytävän ulkopuolelle [4].


Kuva 3. Sanka menee korvan taakse Kuva 4. Mikrofoni suljetun korvakäytävän suulla

Koehenkilöiden välisten fysikaalisten erojen vaikutus korjaussuotimiin voidaan minimoida mittaamalla suljetun korvakäytävän suulta [1].
Mikrofonikapseli voitaisiin myös valaa henkilökohtaiseen korvatulppaan. Tämä poistaisi paljon säätöjä, koska kapselin sijoitus olisi toistettavissa tarkasti.

2.2 Kalibrointi

Suunnittelimme erityisen adapterin mikrofonikapseleille ja hyvin tunnetulle Brüel&Kjær:n kalibraattorille, jotta absoluuttiset äänipaineet olisivat myös jäljitettävissä. Adapteri vaimentaa ympäristön ääntä jopa 40 dB. Tämä on erittäin hyödyllistä, kun kalibrointi suoritetaan meluisassa ympäristössä.

Kuva 5. Mikrofoniadapteri Brüel&Kjær:n kalibraattorille 4230

2.3 Ekvalisointi

Kuvassa 6 on keskiarvoistettuna 16 samanmallisen kuulokkeen (Sennheiser HD 580) taajuusvastetta yhdellä koehenkilöllä. Kuvassa 7 on sama tutkimuksessa käytetylle keinopäälle. Eri koehenkilöiden välillä on huomattavia eroja varsinkin korkeilla taajuuksilla. Jokaiselle koehenkilölle esitettävät näytteet tulisi tämän vuoksi ekvalisoida huolellisesti kuulokevasteen käänteissuodattimella.


Kuva 6. Erään koehenkilön kuulokevaste

Kuva 7. Keinopään kuulokevaste

3 KUUNTELUKOKEET

Tosipäällä äänitetyt näytteet ovat useimpien kuulijoiden mielestä autenttisempia kuin keinopäällä äänitetyt. Yksi keino selvittää, kuinka hyvin äänitysmenetelmä säilyttää alkuperäisen äänitapahtuman, on tutkia koehenkilöiden kykyä lokalisoida tapahtumia kuuntelukokeissa.
Äänitimme ohiajavan auton ääntä laadukkaalla keinopäällä (Cortex Manikin MK2) ja tosipäällä. Koehenkilöiden tehtävä oli vastata, mistä suunnasta auto heidän mielestään ajoi ohitse.
Vahvistaaksemme kokeen tuloksen, järjestimme vielä huolellisemmin valmistellun kokeen 6 kuukautta myöhemmin. Ensimmäisessä kokeessa [7] oli 22 ja toisessa 20 normaalikuuloista koehenkilöä iältään 20-50 vuotta. Heitä ei harjoitettu etukäteen eikä äänityksessä käytettyä koehenkilöä valittu millään erityisellä tavalla. Henkilökohtaisia ekvalisointeja ei tehty, mutta tutkimme myös yleisten kuuloke-ekvalisointien vaikutusta lokalisointiin.

3.1 Tulokset

Toisessa kokeessa koehenkilöiden tekemien virheiden lukumäärä ja sen hajonta olivat hieman pienempiä (taulukko 1).
Taulukko 1. Kuuntelukokeiden tuloksia.
1. koe 2. koe
Virheitä keskimäärin kaikkiaan 28 % 26 %
Virheiden lukumäärien keskihajonta 2.8 1.9
Keinopäävirheitä (kaikista näytteistä) 14 % 12 %
Tosipäävirheitä (kaikista näytteistä) 14 % 13 %
Joukossa oli myös koehenkilöitä, joilla ei ollut lainkaan virheitä keinopää-näytteissä ja toisaalta myös henkilöitä, jotka vastasivat oikein kaikkiin tosipää-näytteistä. Vain kaksi erehdystä sattui näytteissä, joissa auto ajoi oikealta vasemmalle tai vasemmalta oikealle. Nämä näytteet (oikealta vasemmalle ja vasemmalta oikealle) jätettiin varsinaisen tilastollisen analyysiin ulkopuolelle. Ne olivat mukana vain psykologisista syistä: koehenkilölle tulee itseluottamusta vastatessaan selkeään kysymykseen ja näin saadaan vaikeisiinkin kysymyksiin luotettavammat vastaukset. Analyysiin valituista näytteistä (suodatettu keinopää takaa eteen) vastattiin parhaimmillaan lähes neljään viidestä oikein (kuva 8).

Kuva 8. Näytteiden koemenestys (f-suodatus päällä, r-tosipää, d-keinopää, FB-edestä taakse, BF-takaa eteen). Näytteeseen "fdBF" vastattiin lähes neljä kertaa viidestä oikein.

Faktorit analyysissa olivat suunta (takaa eteen tai edestä taakse), pää (keinopää tai tosipää) sekä suodatin (päälle tai pois päältä).
Taulukko 2. Faktoreiden suodatus (FILTER) ja pää (HEAD) yhteisvaikutusten merkittävyys.
HEAD by FILTER (97 % tod.näköisyys) T-testin P-arvo [chi]2 -testin P-arvo
dBF-fdBF 0.02 0.04
rBF-frBF 0.21 0.40
Erittäin merkittävä faktori oli suodatus. Kun ääninäyte kompensoidaan kuulokevasteen käänteissuodattimella, paranee lokalisointi lähes kaikissa tapauksissa (kuva 8 ja taulukko 2) keinopäällä mutta suurella todennäköisyydellä huononee entisestään tosipäällä. Tämä tosin oli odotettavaa: koehenkilön fyysiset mitat eivät välttämättä ole samat mitä äänittävällä henkilöllä ja kun myös suodatus tehdään eri henkilön päälle, tulee ääninäytteeseen entistä enemmän henkilökohtaisia vivahteita.
Hyvin tunnettu lokalisointivirhe binauraalisessa kuuntelussa on äänen aistiminen taakse. Tilastollisesti merkittävä on myös suunnan ja pään yhteisvaikutus. Esimerkiksi suodatetuilla keinopää-näytteillä keskiarvot eroavat 99 %:n todennäköisyydellä toisistaan (taulukko 3). Khiin neliötestin mukaan niiden tulokset riippuvat myös jonkin verran toisistaan, joten tulokseen täytyy suhtautua varauksella.
Taulukko 3. Faktoreiden suunta (FRNTBACK) ja pää (HEAD) yhteisvaikutusten merkittävyys.
HEAD by FRNTBACK (98 % tod.näköisyys) T-testin P-arvo [chi]2 -testin P-arvo
fdFB-fdBF 0.01 0.26
fdBF-frFB 0.03 0.64
Tässä tutkimuksessa tulokset olivat lähes normaalijakautuneet, joten tulosten luotettavuuden kannalta koehenkilöiden pieni määrä ei ole merkittävä tekijä.

4 YHTEENVETO

Tässä julkaisussa esittelimme laitteiston, mitä olemme käyttäneet äänen laadun arviointiin työkoneissa. Totesimme kuuntelukokeen avulla, että laadukas keinopää säilyttää suuntainformaatiota paremmin äänityksessä kuin satunnaisesti valittu koehenkilö. Keinopää-äänityslaitteistoilla on monia etuja, mutta paras laatu äänitapahtuman säilyttämisessä saadaan henkilökohtaisilla äänityksillä ja henkilökohtaisella kuulokevasteen korjauksella. Korjaussuotimen vaikutus on tutkimuksen mukaan merkittävä.

LÄHTEET

1. MØLLER H, 1992, Fundamentals of binaural technology, Applied Acoustics 36, 1992, s. 171-218.
2. HAMMERSHØI D, 1996, Fundamental Aspects of the Binaural Recording and Synthesis Techniques, AES Preprint Number: 4155th (C-8), Convention: 100, (1996 May 11-14).
3. MØLLER H, HAMMERSHØI D, JENSEN C B, SØRENSEN M F, 1995/1, Transfer characteristics of headphones measured on human ears, J. Audio Eng. Soc., Vol. 43, (4), s. 203-217.
4. HAMMERSHØI D, MØLLER H, 1991, Free-field sound transmission to the external ear; a model and some measurements, In Fortschritte der Akustik, DAGA ´91, Bochum, s. 473-476.
5. MØLLER H, JENSEN C B, HAMMERSHØI D, SØRENSEN M F, 1997, Evaluation of Artificial Heads in Listening Tests, AES Preprint Number: 4404th (A1), Convention: 102, (1997 March 22-25).
6. HAMMERSHØI D, MØLLER H, 1996, Sound transmission to and within the human ear canal, The Journal of the Acoustical Society of America, Vol. 100, No.1, July 1996, s.408-427.
7. MAIJALA P, 1997, Better binaural recordings using the real human head, Internoise 97 Proceedings, Vol. II, s.1135-1138.