Autor Wątek: GUI dla programu OCR cuneiform  (Przeczytany 9702 razy)

0 użytkowników i 1 Gość przegląda ten wątek.

Offline robwoj44

  • Aktywny użytkownik
  • ***
  • Wiadomości: 110
    • Zobacz profil
    • Email
GUI dla programu OCR cuneiform
« dnia: Listopada 28, 2013, 21:15:55 »
Program cuneiform do pobrania z http://208.109.22.214/puppy/viewtopic.php?t=90394&sid=33974615da4829d64765850e137f3862
Pic2txt zamieni plik graficzny na plik rtf. Program jest ustawiony na rozpoznawanie tekstu w języku polskim.
« Ostatnia zmiana: Grudnia 07, 2013, 09:06:20 wysłana przez robwoj44 »

Offline Asgard

  • Aktywny użytkownik
  • ***
  • Wiadomości: 181
    • Zobacz profil
    • moje repo germanistyczne
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #1 dnia: Grudnia 01, 2013, 15:26:41 »
Bardzo dziękuję. Dobra robota. Właśnie przetestowałem i widzę, że działa pozytywnie (polskie skany w mig zamienia na tekst; należycie rozpoznaje teksty w ramkach czy kolumnach oraz widzi podstawowe formatowania typu kursywa, tłustość itp.). Podłubałem sobie nieco w skrypcie Twojego autorstwa (pic2txt) i zmieniłem na swoje germanistyczne potrzeby w głównym poleceniu pol na ger i ... też działa (niemieckie umlauty rozpoznaje jak Bóg przykazał). Sprawność cuneiform oceniłbym na jakieś 95-98%, co dla dostępnych (niestety gorszych) rozwiązań linuksowych uważam za bardzo dobry wynik. Wszystko zależy od tego, czy rozdzielczość rozpoznawanego tekstu jest wystarczająca dobra.
« Ostatnia zmiana: Grudnia 01, 2013, 15:33:53 wysłana przez Asgard »
1.8 GHz / 1.25 GB RAM / Precise 5.6.1 full install @ HDD + spolszczenie / rox / śmiga jak błyskawica. Używam zawodowo od lat jako jedynego OS'a, dlatego zawsze z kopią zapasową wszystkich plików w / (odpalam z CD lub pędraka, 30 minut max i system odtworzony z backupa na drugiej partycji)

Offline robwoj44

  • Aktywny użytkownik
  • ***
  • Wiadomości: 110
    • Zobacz profil
    • Email
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #2 dnia: Grudnia 01, 2013, 18:35:37 »
Pierwotnym autorem skryptu jest rcrsn51, ale on był zrobiony dla tesseracta. Zmieniłem go dla cuneiform z uwagi na to, że cuneiform pozwala zrobić plik rtf, na co póki co nie pozwala tesseract.
Rozpoznawalność tekstu przez cuneiform jest faktycznie dobra, choć tesseract daje jeszcze ciut lepszą. Jak jednak napisałem tesseract pozwala tylko na pliki txt, zatem bez formatowania.
Sprawdziłem z ciekawości też komercyjny abbyy w wersji dla linuksa (jest tylko wersja CLI). On w sumie daje najlepsze wyniki, ale...jest tylko w cli i przede wszystkim sam abbyy bierze około 880 mb!
Z typowo linuksowych programów jako jedyny rozpoznaje język polski ocre, ale musi mieć dobrą rozdzielczość i kontrast obrazka. Jednak rozpoznawalność jest już wyraźnie niższa niż cuneiform, tesseract lub abbyy.

Offline Asgard

  • Aktywny użytkownik
  • ***
  • Wiadomości: 181
    • Zobacz profil
    • moje repo germanistyczne
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #3 dnia: Grudnia 01, 2013, 22:06:32 »
O istnieniu natywnego Abbyy dla Linuksa dowiaduję się dopiero od Ciebie i dzięki za tę informację. Dotychczas eksperymentowałem jedynie z wersją demonstracyjną (starszej generacji Abbyy Fine Reader, wersja 8.0 bodajże) poprzez Wine --> efekt rewelacyjny (jak dla mnie dokładnie to, co program OCR umieć).

Dzięki za dobrą robotę i za Twoje inne działalności na rzecz Puppy Linuksa (a najbardziej za spolszczenie systemu).

Pozdrowionka.

Marcin
1.8 GHz / 1.25 GB RAM / Precise 5.6.1 full install @ HDD + spolszczenie / rox / śmiga jak błyskawica. Używam zawodowo od lat jako jedynego OS'a, dlatego zawsze z kopią zapasową wszystkich plików w / (odpalam z CD lub pędraka, 30 minut max i system odtworzony z backupa na drugiej partycji)


Offline robwoj44

  • Aktywny użytkownik
  • ***
  • Wiadomości: 110
    • Zobacz profil
    • Email
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #4 dnia: Grudnia 02, 2013, 09:32:47 »
Abbyy dla linuksa jest już od pewnego czasu, ale jak napisałem tylko w wersji CLI - http://www.ocr4linux.com/en:trial. W moich testach prostej 1 strony polskiego tekstu (bez grafik, tabel, kolumn) miał najmniej błędów, ale niewiele więcej miał tesseract i cuneiform. Pozostałe programy OCR (ocre, gocr, ocrad) ustępowały już wyraźnie. Jest jeszcze vuescan z polskim modułem ocr, ale wypada słabiej niż abbyy, tesseract i cuneiform.
Cóż działam w puppy aktywnie już 5 lat. Trochę różnych kompilacji się zebrało (coś ponad 250) plus faktycznie spolszczenie, które wystartowało już w 2010 rok i stopniowo w miarę możliwości rozrosło się z 30 tłumaczeń do ponad 230 o ile dobrze pamiętam:-)
« Ostatnia zmiana: Grudnia 03, 2013, 15:46:34 wysłana przez robwoj44 »

Offline robwoj44

  • Aktywny użytkownik
  • ***
  • Wiadomości: 110
    • Zobacz profil
    • Email
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #5 dnia: Grudnia 07, 2013, 09:09:29 »
Dodałem opcję wyboru języka bezpośrednio w pic2txt. Możliwe opcje: eng, ger, fra, rus, swe, spa, ita, ruseng, ukr, srp, hrv, pol, dan, por, dut, cze, rum, hun, bul, slv, lit, est, tur. Standardowo ustawione pol, czyli polski.

Offline Asgard

  • Aktywny użytkownik
  • ***
  • Wiadomości: 181
    • Zobacz profil
    • moje repo germanistyczne
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #6 dnia: Grudnia 07, 2013, 10:15:41 »
Wow, dzięki. Jakbyś mi w myślał czytał. Właśnie takiego dingsa mi było potrzeba. Pozdrowionka.
1.8 GHz / 1.25 GB RAM / Precise 5.6.1 full install @ HDD + spolszczenie / rox / śmiga jak błyskawica. Używam zawodowo od lat jako jedynego OS'a, dlatego zawsze z kopią zapasową wszystkich plików w / (odpalam z CD lub pędraka, 30 minut max i system odtworzony z backupa na drugiej partycji)

Offline robwoj44

  • Aktywny użytkownik
  • ***
  • Wiadomości: 110
    • Zobacz profil
    • Email
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #7 dnia: Grudnia 07, 2013, 21:06:56 »
Nawet nie w myślach. Przeczytałem w Twoim poście powyżej:-)

Offline Asgard

  • Aktywny użytkownik
  • ***
  • Wiadomości: 181
    • Zobacz profil
    • moje repo germanistyczne
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #8 dnia: Grudnia 08, 2013, 01:40:26 »
:)

Dopiero teraz zabrałem się do kolejnych testów praktycznych Cuneiform oraz nakładki pic2txt. Wszystko działa i efekty - jak na darmowy i niekomercyjny soft - naprawdę bardzo dobre:

https://yadi.sk/d/scRx8DxndeB3x

Zmieniłem język na niemiecki (ger), dałem mu pliki JPG 300 dpi z niemieckim tekstem. Teksty niemieckie przeczytane właściwie w 100% (nie potrafił jedynie skapnąć się, że to test językowy i że po wypunktowaniach może być kropka kończąca zdanie/punkt testowy). Trzecia strona przeczytana w całości, choć zgłupiał na kolumnach/numeracji (być może da się tu cośkolwiek jeszcze poprawić manipulując rozdzielczością, ale nie chce mi się testować, bo i tak jestem bardzo zadowolony z tego, co toto potrafi). Mojego nazwiska z polską literką "ń" w stopkach dokumentu nie załapał, ale miał prawo, bo działał przecież w trybie języka niemieckiego, w którym takiego "krzaczka" nie ma.

Bardzo dzięki jeszcze raz. Do skanowania np. "normalnych" tekstów/książek (nawet z jakimś tak formatowaniem/kolumnowaniem) nadaje się bardzo dobrze i jest faktycznie niezmiernie szybki), no i darmowy, no i pójdzie nawet na starożytnym sprzęciorze.
« Ostatnia zmiana: Grudnia 26, 2014, 19:50:56 wysłana przez Asgard »
1.8 GHz / 1.25 GB RAM / Precise 5.6.1 full install @ HDD + spolszczenie / rox / śmiga jak błyskawica. Używam zawodowo od lat jako jedynego OS'a, dlatego zawsze z kopią zapasową wszystkich plików w / (odpalam z CD lub pędraka, 30 minut max i system odtworzony z backupa na drugiej partycji)

Offline kris55555

  • Aktywny użytkownik
  • ***
  • Wiadomości: 113
    • Zobacz profil
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #9 dnia: Grudnia 08, 2013, 08:42:13 »
Pobrałem, zainstalowałem, przetestowałem i mam pewne uwagi.
Cuneiform oraz nakładka pic2txt działa OK. Często jednak przy odczytwwaniu różnych dokumentów pdf występowały u mnie błędy, stwierdziłem, że jest to spowodowane jakością pliku graficznego, a głównie jednak jakością pliku pdf z którego wykonywany był plik graficzny. Tak jak napisał Asgard - manipulując rozdzielczością (jakością) pliku graficznego można znacznie poprawic otrzymane efekty. Ilość błędów znacznie się zwiększa, gdy np. tło pliku graficznego na którym jest tekst - nie jest idealnie białe lub posiada jakiekolwiek "zakłócenia" widoczne dopiero na dużym powiększeniu (jest np. szare, lub posiada jakąkolwiek fakture). Warto poeksperymentować, bo wyniki są ciekawe, a sam program bardzo pomocny.
« Ostatnia zmiana: Grudnia 08, 2013, 11:26:19 wysłana przez kris55555 »

Offline robwoj44

  • Aktywny użytkownik
  • ***
  • Wiadomości: 110
    • Zobacz profil
    • Email
Odp: GUI dla programu OCR cuneiform
« Odpowiedź #10 dnia: Grudnia 08, 2013, 12:08:36 »
Z ciekawości sprawdziłem niemieckie pliki testowe Asgarda w pic2txt przeznaczonym dla tesseracta http://www.murga-linux.com/puppy/viewtopic.php?t=61046 Wydaje się, że w przypadku niemieckiego lepsze są jednak wyniki uzyskane poprzez cuneiform. Aczkolwiek, jak napisałem wcześniej, w przypadku polskiego oba programy bardzo dobrze się sprawują i nawet błędy, które są nie wymagają oglądania pliku źródłowego, gdyż są tak nieznaczne.
Tak jak napisał kris55555 ważny jest dobry plik graficzny. W każdym razie sam po kilku latach przetestowałem programy do OCR, zwłaszcza pod kątem języka polskiego i jestem w pełni zadowolony z otrzymanych wyników. Można śmiało stwierdzić, że OCR w linuksie nie jest już problemem jakim był kilka lat temu.
« Ostatnia zmiana: Grudnia 08, 2013, 12:10:43 wysłana przez robwoj44 »