VilágHalló online felolvasó rendszer |
|
A VILÁGHALLÓ egy nyílt forráskódú internetes online felolvasó rendszer, mely az interneten lévő szövegeket mesterségesen generált emberi beszéd formájában teszi hallhatóvá. A VILÁGHALLÓ egy központilag menedzselt integrált szolgáltatás, ami az elérhető szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy "szövegrádió") egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen. Ez a megoldás szerzői jogi szempontból is előnyös, mert a szöveg nem jelenik meg önállóan a felhasználónál. Lehetőség van az idegen szavak, tulajdonnevek kiejtésének központi kezelésére. A szoftver-komponensek és a szövegállomány változásainak követését a szolgáltató végzi. Hogy csak a fontosabbakat említsük: a beszédgeneráló motor fejlettebb verzióra cserélése (pl. több hangszín, állítható sebesség), az újabb motorok (pl. idegen nyelvű) beépítése, az elektronikus formában elérhetővé vált szövegek, szövegábrázolási standardok (pl. XML, TEI) használata, a számítógépes nyelvi elemzés új eredményeinek felhasználása. A VILÁGHALLÓ a tárolt szövegeket a felolvasásra legalkalmasabb formátumra hozza függetlenül eredeti formátumuktól és a felolvasás szempontjából fontos, strukturális és nyelvi annotációkkal látja el (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az - akár ragozott - idegenszó illetve név helyes kiejtése). Mindehhez elegendő egy kliens programot letölteni és az internetre kapcsolódni, akár telefonvonalon is. A VILÁGHALLÓ egységes közeget és a vakok által is könnyen, vizuális információk nélkül is kezelhető felhasználói felületet biztosít. Ez a felület személyre szabható, beállítható. A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart). A felhasználói beállítások közül az egyik legfontosabb a "KÖNYVJELZŐ" funkció, mely lehetőséget biztosít arra, hogy ott folytassuk a könyvet ahol abbahagytuk. Az alkalmazás jelenleg a Profivox beszédszintetizáló motort használja. A ProfiVox magyar nyelvű beszédgeneráló szoftver (TTS, Text-to-Speech), amely közel 10 év munkájának eredménye. A BME Távközlési és Médiainformatikai Tanszék kiemelkedő kutatói fejlesztették és ma is folyamatosan fejlesztik. Pillanatnyilag ez a legszebben beszélő magyar TTS motor. |