Tech techline.hu 2011. február. 17. 05:15

Szöveg kivonása képekből, a legegyszerűbben

Előfordulhat, hogy egy képi állomány olyan szöveget rejt, amelyre szerkeszthető fájlként lenne szükségünk.

Előfordulhat, hogy egy képi állomány olyan szöveget rejt, amelyre szerkeszthető fájlként lenne szükségünk. Ilyenkor jönnek jól az OCR-programok, illetve -szolgáltatások, amelyekkel ma már tele a web. És ami a legjobb az egészben, általában még fizetni sem kell értük.
Itt van mindjárt az OCR Terminal, ami számos nyelvet ismer, különféle képekkel és még a pdf formátummal is elboldogul, igaz, csak korlátozottan használható ingyen. Részletesen itt írtunk róla.
Léteznek ingyenes, hasonló feladatot ellátó programok is, ilyen például a JOCR (letölthető innen, illetve itt olvasható részletesen a használatáról.
Az OCR Converter egyesíti az előzőek pozitívumait: ingyenes, nem kell telepíteni, egyszerű a használata és gyors eredményt ad.

Egyszerű, gyors és ingyenes

Ha megvan a kép vagy a pdf, amelyből csak a szövegre van szükségünk, egyszerűen kattintsunk az Input Fájl kiválasztása gombra, majd töltsük fel a szóban forgó állományt. Ezután válasszuk ki a szöveg nyelvét (sajnos itt a magyar nem szerepel a lehetőségek között), majd kattintsunk a Process-re. Néhány másodperc elteltével megkapjuk txt fájlban a végeredményt. Mi azért kíváncsiak voltunk, mi van akkor, ha magyar szöveggel etetjük meg a rendszert. Érdekes módon az é betűt felismerte, a többi ékezettel viszont meggyűlt a baja, ennek ellenére a visszakapott szöveg használható volt. Azaz ha valakinek nagyon szüksége van ilyen képformátumú szöveg szerkeszthető változatára, még így is megéri az OCR Converter használata. Azt viszont tudni kell, hogy a kézírást nem tudja értelmezni a rendszer.
Hasonlóan működik a Free Online OCR szolgáltatás is. Ugyanúgy fel kell tölteni a választott képet, viszont a kimeneti formátumok választéka már jóval gazdagabb.

Többféle kimeneti formátum közül választhatunk

A szolgáltatás hasonlóan gyors, mint az előző, sőt itt még egy skálán nyomon is követhetjük, hogy hol tart a feldolgozás. Sajnos a magyar ékezetes karakterekkel még annyira sem boldogul a rendszer, mint az előző esetben, viszont ha a pdf-et választjuk kimenetként, tökéletes szöveget kapunk vissza.

Hirdetés
hvg360 Tiszai Balázs 2025. január. 06. 09:30

MVM-terjeszkedés Romániában: a helyiek szerint Orbán most tolja be az országba Putyin trójai falovát

A magyar állami energiacég kivásárolja a német E.On-t Románia második legnagyobb gázcégéből. A helyi félelmek szerint, ha az üzlet lezárul, az MVM orosz gázzal fogja ellátni az ország háztartásainak csaknem felét, és ezzel nagyban erősödik Moszkva befolyása Bukarestben. A tranzakció 2025 első felében zárulhat, de még elkaszálhatják. Ennek az esélyét erősítheti az a sürgősségi rendelet, mellyel a román kormány megakadályozhatja a stratégiai fontosságú vállalatok “ellenséges” átvételét.