I. Elméleti ismeretek:

  Bevezető
  ZAJ!
  A digitális hangrekonstrukció
  Hangfelvételi manipuláció
     Mesterséges beszédhang
     Hangutánzás
  Hangazonosítás

II. Szolgáltatások:

  Hanghordozó fizikai rekonstrukciója
  Hangrestaurálás, minőségjavítás
  Jegyzőkönyv készítés
  Hangazonosítás
  Bizalmas információkezelés


III. Linkek

 

 

 

 

Hangazonosítás

 

Az emberi beszédhang vizsgálata és összehasonlítása gyakran visszatérő feladat a bűnügyi gyakorlatban.

Ma már egyre többen kerülnek kapcsolatba, látnak filmeken olyan hangazonosító rendszereket, biztonsági kapukat, felismerőket, ahol a rendszer a tárolt beszédhang alapján azonosítja az illetőt. Ilyenkor az eltárolt hangminta optimális minőségű (hiszen a személy közreműködésével, célzottan készült), továbbá azonosításkor az illetőnek érdeke, hogy őt felismerjék, azaz mindent elkövet, hogy természetes hangján beszéljen. Ez a fajta hangazonosítás gyakorlatilag megoldottnak tekinthető, bár egy kiadós megfázás, torokgyulladás, sőt akár egy fogászati beavatkozás is kínos szituációt eredményezhet. Egy ötvenes éveiben járó ismerős mesélte, hogy új protézisének köszönhetően a biztonsági rendszer szisztematikusan nem engedte be munkahelyének biztosított területére és új hangmintát kellett rögzíteni tőle.

Igazságügyi területen a helyzet sokkal összetettebb. A bűnügyben keletkezett alap hangfelvétel természetesen nem “összehasonlítás céljára” készült. A hangminta rögzítésekor a gyanúsított gyakran manipulálja a hangját, nem beszélve arról, hogy sokszor nincs is hangminta, hanem két operatív úton készült, egymástól teljességgel független beszédhang felvételről kellene megállapítani, hogy azonos személyekről van-e szó.

Alapvető probléma a felvétel alapzaja, spektrálisan sérült státusza (a telefonvonal torzít, a hangrögzítő eszköz hibás, átviteli jellemzői gyengék) mely -mint a korábbiakban már említésre került- egyre jobban kézbentartható, a felvétel –kitartó munkával- javítható, restaurálható.

Az összehasonlítási vizsgálat alapvetően spektrális, spektrografikus (hangszínképelemzés) módszereivel történő aprólékos, hangról hangra analízist igényel.

Az objektív összehasonlítás lefolytatásához 80-100 összehasonlítható mintára van szükség, ami normál beszédtempónál durván egy perc tiszta hangfelvételt jelent. Ha ez rendelkezésre áll, akár a 90% fölötti azonossági valószínűség is elérhető. Minél több a minta, annál nagyobb az esély.

A kriminalisztikai összehasonlításoknál azonban ritkán áll rendelkezésre ennyi hanganyag! Gondoljunk csak a manapság megszaporodott bombarobbantásos fenyegető telefonos bejelentésekre, ahol a rendelkezésre álló szöveg csupán néhány szó. A nem elegendően nagy felállítható adatbázis és a vizsgálat eredményességét, a kijelenhető azonossági valószínűség mértékét csökkenti.

A vizsgálatok során alkalmazott matematikai módszerek:

• FFT, FFTW

• CEPSTRUM

• SPECTROGRAM

• LPC, LPCW analízis

 

Fent a hangjel, középen a kiválasztott szegmens FFT spektruma, alul cepstruma látható.

 

A hangfelvételi szakasz térbeli FFT, azaz FFTW (waterfall) spektruma látható, melyből “ki lehet szeletelni” az egyes idő-pillanatokhoz tartozó FFT információt.

 

Fent a hangjel, alul párhuzamosan a spektrogram látható az energia kontúrokkal.

 

Színes spektrogram ábra . A spektroram egy háromdimenziós leképezési módszer, vízszintesen az idő, függőlegesen frekvencia és sötétedő színekkel az intenzitás reprodukálható. A mai modern informatikai alapú eszközökkel kitűnően vizsgálhatóak a formánsok, felharmonikusok.


A "Kukac felmászott a fára" mondat spektrogramja.
Jól látható a mássalhangzók zörejes, aperiodikus szerkezete és a magánhangzók periodikus, felharmonikus struktúrája.

 

Alapvető kérdés, hogy a spektrális vizsgálat során felfedett hasonlóságok milyen mértékű azonossági valószínűséget takarnak? A hangazonosság, annak valószínűsége nem egyenértékű a személyazonossággal, annak valószínűségével. Két spektrálisan igen közel álló hangminta adatbázis milyen személyazonossági valószínűséggel egyenértékű? Egy tetszőlegesen kiválasztott személy környezetébe mekkora képzeletbeli populációjú kör definiálható, melyen belül nem valószínű, hogy találunk másik olyan személyt, akinek beszédhangspektrum jellemzői azonosak?

Problémát jelenthet az időfaktor is, azaz amikor egy sokéves hangfelvétellel kell összehasonlítani valakit. Hangunk az életkor előrehaladtával némileg változik. Vannak bizonyos formánsösszetevők melyek lényegében nem változnak, míg vannak melyek jelentősen.

Érdekesség, hogy vajon a beszédhang alapján következtethetünk-e a beszélő, megjelenésére, fizikumára? A válasz igen, hiszen pl. az életkor, az alkat köthető a beszédhez.

 

 
ugrás a lap tetejére