Tech techline.hu 2007. december. 21. 16:11

Kipróbáltuk: beszélő szoftverek

Pillanatnyilag a beszéd a leghatékonyabb eszköz, amivel kommunikálni tudunk – ez a...

Pillanatnyilag a beszéd a leghatékonyabb eszköz, amivel kommunikálni tudunk – ez a telepátia „feltalálásáig” valószínűleg így is marad. Bár nagyon szépen le tudjuk írni gondolatainkat, ha valami igazán fontos dologról van szó, akkor rögtön elfelejtődnek az üzenetek, az e-mailek vagy levelek és előkerül a „beszéljük meg" effektus… Semmi meglepő sincs tehát abban, hogy a PC-vel való kommunikáció leghatékonyabb formája szintén a beszéd, tudományos nevén audió-vizuális  interaktív kommunikáció. (Amikor csak egy billentyűzet/egér/monitor összeállítással dolgozunk, nos az a vizuális interaktív-kommunikáció).

Az elnevezés borzasztó, viszont jól összefoglalja a gépekkel való kommunikácó legújabb változatának tulajdonságait: audió-, mivel beszédben utasítjuk a gépet, és a gép is „válaszol” parancsainkra; vizuális-, mert rögtön látjuk is kimondott parancsaink hatását, interaktív-, mivel a gép és a felhasználó reagál egymásra, a kommunikáció pedig igazán egyértelmű. Ha van egy mikrofonunk és egy hangkártyánk akkor mi is kipróbálhatjuk a kommunikálás ezen változatát, csupán pár speciális szoftverre lesz szükségünk. Jogosan merülhet fel a kérdés: ha a számítógép leghatákonyabb vezérlési módszere a beszéd, akkor mi az oka annak, hogy több mint ötven éve csak billentyűzeten és monitoron keresztül kommunikálunk gépeinkkel? A válasz nagyon egyszerű: a számítógépek hőskorától egészen a nyolcvanas évek végéig, a gyártók örültek ha két különböző hangmagasságú sípolást ki tudtak csikarni a gépből – zenéről, effektekről, pláne digitalizált beszédhangokról csak álmodhattak. A technikai korlát csak az utóbbi tíz-tizenöt évben, a mintavett hangok térnyerésének és a hangkártyák fejlődésének kapcsán tűnt el. Viszont olyan hatékonyan tűnt el, hogy napjainkban szinte kizárt, hogy olyan gépet találunk amelynek a hangkártyája ne legyen alkalmas az audió-kommunikációs szoftverek kezelésére. 

Nem volt tehát nehéz dolgunk a tesztelésnél: egyszerűen telepítenünk kellett a szóban forgó szoftvert, majd figyelni a kommunikáció egyszerűségét, a hangok tisztaságát, és a szoftver kezelhetőségét. Az audió-kommunikációs szoftvereknek két típusa van: egy egyik az ún. „felolvasó” szoftverek (TTS, azaz text-to-speech), a másik pedig a kommunikációs- és vezérlő szoftverek. Előbbi csak arra használható, hogy szöveges állományokat és egyéb a képernyőn megjelenő információkat olvasson fel, míg az utóbbi segítségével már hangunkkal vezérelhetjük a PC-t. 

SmartRead
http://www.smartysoft.com/ - ingyenes

Kezdjük az ismerkedést egy viszonylag egyszerű szoftverrel – a SmartRead, mint neve is mutatja, szöveges állományaink illetve a monitor „tartalmának” felolvasására képes. Oda-vissza kommunikáció ebben az esetben nem lehetséges (a SmartRead csak egy felolvasó szoftver), mikrofonra tehát nem lesz szükségünk, csak hangkártyára és hangfalakra. Telepítás után hagyjunk magunknak pár percet, hogy túlessünk a rettenetesen csúnya kezelőfelület okozta megrázkodtátáson – szerencsére, amilyen csúnya a kép, olyan jó a hang… A szoftver pillanatnyilag két nyelven képes kommunikálni: angolul, illetve kínaiul. Kezelni nem túl bonyolult, a felületbe illesztett, illetve vágólapra helyezett szöveges állományokat tudjuk ékes angol (vagy kínai) nyelven meghallgatni. A beépített hangminták nem rosszak, sajnos kicsit gépiesek, viszont a szoftver ingyenes, szóval ezt a kis hibát talán elnézhetjük. A fejlesztő honlapjáról további beszédhangokat tölthetünk le, ezek a Mary, Mike, Sam és hasonló fantázianevekre hallgatnak. Ha egyik hangszín sem megfelelő, akkor a SmartRead SDK letölthető verziójának segítségével bármilyen hangot elkészíthetünk . persze ez elég hosszadalmas munka. A szoftver egyszerű és ingyenes, sajnos ennek megfelelően tudása nem kimagasló – a „hangos” szoftverekkel való ismerkedéshez mindenesetre jó lehet.

TalkItTypeit
http://www.xpressionsmedia.com - demó

Az Xpressionsmedia szoftvere valószínűleg a világ leglustább embereinek készült – ennek a szoftvercsomagnak a segítségével ugyanis a kisujjunkat sem kell megmozdítanunk a mindennapi munka során, az egeret és a billentyűzetet pedig akár ki is dobhatjuk… Hangvezérléssel működő szoftverről lévén szó, a hangkártya mellett egy mikrofonra vagy headset-re is szükségünk lesz, hogy működésre bírjuk. Ha viszont mindent bekonfiguráltunk, és túlestünk a szoftver „betanításán” (be kell ugyanis tanítani, hogy megismerje és megértse hangunkat/hangszínünket) akkor úgy érezhetjük, mintha egy virtuális tikárnő lenne az asztalunkon. 

Diktálhatunk leveleket vagy e-maileket, chat-programunk mostantól engedelmes kisangyalként engedelmeskedik – a csetelés sokkal nagyobb elmény, ha nem kell foglalkoznunk a gépeléssel… Bármilyen Windows alapú alkalmazáshoz hozzátársíthatjuk újdonsült virtuális titkárnőnket, így gyakorlatilag minden szoftverünket el tudjuk indítani, illetve tudjuk vezérelni kizárólag szóban kiadott utasítások segítségével. A tesztelés során a következő szoftverekkel működött együtt tökéletesen: Microsoft Word, Corel WordPerfect, Microsoft Outlook Express, AOL Chat. PhotoShop Pro, Opera, Adobe Acrobat Reader. A lista alapján valószínű, hogy majdnem minden szoftverrel elboldogul, hiszen csak tőlünk függ, hogy melyik szoftverhez, milyen hang-utasításokat rendelünk hozzá. A szoftvereken felül természetesen teljeshangvezérlést kapunk az operációs rendszerhez is: a sajátgép vagy az intéző megnyitása, esetleg egy viruskereső elindítása mostantól csak egy szavunkba kerül ! Egy ingyenes plugin segítségével (a fejlesztők honlapjáról letölthető) az internetes navigációt, azaz a böngészést is hangvezérlésűvé tehetjük – még azt is megmondhatjku, hogy melyik linkre „klikkeljen” a virtuális titkárnő. A szoftvercsomag két részből áll, az egyik a billentyűzet kiváltására szolgált, a másik pedig az egeret van hivatva helyettesíteni. Ezek a csomagok külön-külön is használhatóak. Sajnos a szoftver nem olcsó, viszont nagyon jó hangfelismerő algoritmussal rendelkezik, szinte teljesen hibamentesen fut, ráadásul rengeteg extra szolgáltatást találunk benne.  Alapesetben 60,000 angol utasítás képes megérteni, de persze mi is taníthatunk neki újakat, sőt megpróbálhatjuk megtanítani magyarul is. 

Weboldal konvertálása hangfájlba - iYak
http://www.sartuga.com - demó

Bármilyen furcsán is hangzik, ez a kis segédprogram arra való, hogy kedvenc weboldalainkat hanggá alakíthassuk… A szoftver egyszerűen lementi a weboldakak tartalmát (blog olvasgatáshoz tökéletes), amit mi később MP3 lejátszónk segítségével bárhol meghallgathatunk.

A hangok  SAPI 5 kompatibilis ún. voice fontok (www.cepstral.com), tehát gyönyőrűen szólnak, nagyon élethűek, ráadásul bármilyen SAPI 5 hangszínt letölthetünk, ha esetleg nem nyeri meg tetszésünket az alaphangok egyike sem. Újságolvasgatáshoz, vagy hosszabb internetes cikkekhez tökéletes. Sajnos csak angol nyelvű.

Advanced Text To MP3 Converter
http://tucows.altectelecoms.gr/preview/289358.html - shareware

Ennek a kis segédszoftvernek a segítségével rögtön WAV vagy MP3 fájlba menthetjük a felolvasott szöveget, így CD-re írva hallgathatjuk pl. elektronikus könyveinket vagy akár weboldalak és hirlevelek szövegeit. Érdekes funkciója a „real time speech” – ez annyit tesz, hogy amit éppen gépelünk azt rögtön vissza is halljuk: a helyesírási vagy elgépelési hibák így gyorsan és könnyen kiszűrhetőek egy-egy hosszabb anyag gépelése közben. (szakdolgozat ításához tökéletes!) A szoftver elboldogul TXT, DOC vagy akár HTML állományokkal is, persze ha a dokumentumban található egy nagy darab táblázat esetleg képek is, akkor gyorsan le tudjuk fagyasztani… Legnagyobb előnye, hogy képes több fájlt egymás után felolvasni, így gyakorlatilag semmi különösebb dolgunk nincs vele: csak megadjuk mely dokumentumokat akarjuk hallani, és máris kényelmesen hátradőlve hallgathatjuk a felolvasást...



Hirdetés
Címkék
Kult Köves Gábor 2024. december. 29. 20:00

Dobó Kata amerikai filmje és Andy Vajna vikingjei is az élmezőnyben – Hollywood legnagyobb bukásai

Hollywood legnagyobb bukásai közt van olyan film, amely öt rendezőt fogyasztott el, köztük Coppolát is. És olyan is, amelynek zsiráf szereplője rálépett a saját péniszére. Börtönbe küldött rendező, reciklált díszlet, elhízott rabszolgalány és egy elképesztő szexjelenet – Tim Robey, a Telegraph filmes újságírója Box Office Poison című könyvében mesél a legendás bukások hátteréről. A szerzővel beszélgettünk.