Puppy Linux • Forum polskiej społeczności

Pomoc => Software => Wątek zaczęty przez: robwoj44 w Listopada 28, 2013, 21:15:55

Tytuł: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: robwoj44 w Listopada 28, 2013, 21:15:55
Program cuneiform do pobrania z http://208.109.22.214/puppy/viewtopic.php?t=90394&sid=33974615da4829d64765850e137f3862 (http://208.109.22.214/puppy/viewtopic.php?t=90394&sid=33974615da4829d64765850e137f3862)
Pic2txt zamieni plik graficzny na plik rtf. Program jest ustawiony na rozpoznawanie tekstu w języku polskim.
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: Asgard w Grudnia 01, 2013, 15:26:41
Bardzo dziękuję. Dobra robota. Właśnie przetestowałem i widzę, że działa pozytywnie (polskie skany w mig zamienia na tekst; należycie rozpoznaje teksty w ramkach czy kolumnach oraz widzi podstawowe formatowania typu kursywa, tłustość itp.). Podłubałem sobie nieco w skrypcie Twojego autorstwa (pic2txt) i zmieniłem na swoje germanistyczne potrzeby w głównym poleceniu pol na ger i ... też działa (niemieckie umlauty rozpoznaje jak Bóg przykazał). Sprawność cuneiform oceniłbym na jakieś 95-98%, co dla dostępnych (niestety gorszych) rozwiązań linuksowych uważam za bardzo dobry wynik. Wszystko zależy od tego, czy rozdzielczość rozpoznawanego tekstu jest wystarczająca dobra.
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: robwoj44 w Grudnia 01, 2013, 18:35:37
Pierwotnym autorem skryptu jest rcrsn51, ale on był zrobiony dla tesseracta. Zmieniłem go dla cuneiform z uwagi na to, że cuneiform pozwala zrobić plik rtf, na co póki co nie pozwala tesseract.
Rozpoznawalność tekstu przez cuneiform jest faktycznie dobra, choć tesseract daje jeszcze ciut lepszą. Jak jednak napisałem tesseract pozwala tylko na pliki txt, zatem bez formatowania.
Sprawdziłem z ciekawości też komercyjny abbyy w wersji dla linuksa (jest tylko wersja CLI). On w sumie daje najlepsze wyniki, ale...jest tylko w cli i przede wszystkim sam abbyy bierze około 880 mb!
Z typowo linuksowych programów jako jedyny rozpoznaje język polski ocre, ale musi mieć dobrą rozdzielczość i kontrast obrazka. Jednak rozpoznawalność jest już wyraźnie niższa niż cuneiform, tesseract lub abbyy.
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: Asgard w Grudnia 01, 2013, 22:06:32
O istnieniu natywnego Abbyy dla Linuksa dowiaduję się dopiero od Ciebie i dzięki za tę informację. Dotychczas eksperymentowałem jedynie z wersją demonstracyjną (starszej generacji Abbyy Fine Reader, wersja 8.0 bodajże) poprzez Wine --> efekt rewelacyjny (jak dla mnie dokładnie to, co program OCR umieć).

Dzięki za dobrą robotę i za Twoje inne działalności na rzecz Puppy Linuksa (a najbardziej za spolszczenie systemu).

Pozdrowionka.

Marcin
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: robwoj44 w Grudnia 02, 2013, 09:32:47
Abbyy dla linuksa jest już od pewnego czasu, ale jak napisałem tylko w wersji CLI - http://www.ocr4linux.com/en:trial (http://www.ocr4linux.com/en:trial). W moich testach prostej 1 strony polskiego tekstu (bez grafik, tabel, kolumn) miał najmniej błędów, ale niewiele więcej miał tesseract i cuneiform. Pozostałe programy OCR (ocre, gocr, ocrad) ustępowały już wyraźnie. Jest jeszcze vuescan z polskim modułem ocr, ale wypada słabiej niż abbyy, tesseract i cuneiform.
Cóż działam w puppy aktywnie już 5 lat. Trochę różnych kompilacji się zebrało (coś ponad 250) plus faktycznie spolszczenie, które wystartowało już w 2010 rok i stopniowo w miarę możliwości rozrosło się z 30 tłumaczeń do ponad 230 o ile dobrze pamiętam:-)
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: robwoj44 w Grudnia 07, 2013, 09:09:29
Dodałem opcję wyboru języka bezpośrednio w pic2txt. Możliwe opcje: eng, ger, fra, rus, swe, spa, ita, ruseng, ukr, srp, hrv, pol, dan, por, dut, cze, rum, hun, bul, slv, lit, est, tur. Standardowo ustawione pol, czyli polski.
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: Asgard w Grudnia 07, 2013, 10:15:41
Wow, dzięki. Jakbyś mi w myślał czytał. Właśnie takiego dingsa mi było potrzeba. Pozdrowionka.
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: robwoj44 w Grudnia 07, 2013, 21:06:56
Nawet nie w myślach. Przeczytałem w Twoim poście powyżej:-)
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: Asgard w Grudnia 08, 2013, 01:40:26
:)

Dopiero teraz zabrałem się do kolejnych testów praktycznych Cuneiform oraz nakładki pic2txt. Wszystko działa i efekty - jak na darmowy i niekomercyjny soft - naprawdę bardzo dobre:

https://yadi.sk/d/scRx8DxndeB3x

Zmieniłem język na niemiecki (ger), dałem mu pliki JPG 300 dpi z niemieckim tekstem. Teksty niemieckie przeczytane właściwie w 100% (nie potrafił jedynie skapnąć się, że to test językowy i że po wypunktowaniach może być kropka kończąca zdanie/punkt testowy). Trzecia strona przeczytana w całości, choć zgłupiał na kolumnach/numeracji (być może da się tu cośkolwiek jeszcze poprawić manipulując rozdzielczością, ale nie chce mi się testować, bo i tak jestem bardzo zadowolony z tego, co toto potrafi). Mojego nazwiska z polską literką "ń" w stopkach dokumentu nie załapał, ale miał prawo, bo działał przecież w trybie języka niemieckiego, w którym takiego "krzaczka" nie ma.

Bardzo dzięki jeszcze raz. Do skanowania np. "normalnych" tekstów/książek (nawet z jakimś tak formatowaniem/kolumnowaniem) nadaje się bardzo dobrze i jest faktycznie niezmiernie szybki), no i darmowy, no i pójdzie nawet na starożytnym sprzęciorze.
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: kris55555 w Grudnia 08, 2013, 08:42:13
Pobrałem, zainstalowałem, przetestowałem i mam pewne uwagi.
Cuneiform oraz nakładka pic2txt działa OK. Często jednak przy odczytwwaniu różnych dokumentów pdf występowały u mnie błędy, stwierdziłem, że jest to spowodowane jakością pliku graficznego, a głównie jednak jakością pliku pdf z którego wykonywany był plik graficzny. Tak jak napisał Asgard - manipulując rozdzielczością (jakością) pliku graficznego można znacznie poprawic otrzymane efekty. Ilość błędów znacznie się zwiększa, gdy np. tło pliku graficznego na którym jest tekst - nie jest idealnie białe lub posiada jakiekolwiek "zakłócenia" widoczne dopiero na dużym powiększeniu (jest np. szare, lub posiada jakąkolwiek fakture). Warto poeksperymentować, bo wyniki są ciekawe, a sam program bardzo pomocny.
Tytuł: Odp: GUI dla programu OCR cuneiform
Wiadomość wysłana przez: robwoj44 w Grudnia 08, 2013, 12:08:36
Z ciekawości sprawdziłem niemieckie pliki testowe Asgarda w pic2txt przeznaczonym dla tesseracta http://www.murga-linux.com/puppy/viewtopic.php?t=61046 (http://www.murga-linux.com/puppy/viewtopic.php?t=61046) Wydaje się, że w przypadku niemieckiego lepsze są jednak wyniki uzyskane poprzez cuneiform. Aczkolwiek, jak napisałem wcześniej, w przypadku polskiego oba programy bardzo dobrze się sprawują i nawet błędy, które są nie wymagają oglądania pliku źródłowego, gdyż są tak nieznaczne.
Tak jak napisał kris55555 ważny jest dobry plik graficzny. W każdym razie sam po kilku latach przetestowałem programy do OCR, zwłaszcza pod kątem języka polskiego i jestem w pełni zadowolony z otrzymanych wyników. Można śmiało stwierdzić, że OCR w linuksie nie jest już problemem jakim był kilka lat temu.