Analiza i porównanie skuteczności metod rozpoznawania tekstu w obrazach o zróżnicowanych cechach wizualnych

Zgłaszający: dr inż. Witold Czajewski
  • Status dostępności:Wolny
  • Słowa kluczowe:OCR, rozpoznawanie tekstu, głębokie sieci neuronowe
  • Opis:

    Celem projektu jest przetestowanie i porównanie różnych metod rozpoznawania tekstu (OCR) w obrazach zawierających tekst o różnej orientacji, kolorystyce, tle i zakłóceniach. Należy wybrać kilka podejść do rozpoznawania tekstu, obejmujących zarówno klasyczne systemy OCR (np. Tesseract), jak i nowoczesne metody oparte na głębokim uczeniu (np. TrOCR, Donut, PaddleOCR, PP-OCRv3). W ramach pracy należy przygotować zestaw testowy obrazów zawierających tekst w różnych układach (np. poziomym, zakrzywionym, pod kątem, na tle naturalnym, reklamowym, w dokumentach), a następnie dokonać porównania dokładności rozpoznanego tekstu względem danych referencyjnych. W ocenie należy uwzględnić zarówno jakość rozpoznanego tekstu, jak i odporność poszczególnych metod na trudne warunki wizualne. Na końcu projektu należy przedstawić analizę porównawczą, wskazać przypadki szczególnie trudne dla wybranych narzędzi oraz zaproponować możliwe sposoby poprawy skuteczności.

  • Typ pracy: inżynierski magisterski projekt zespołowy projekt przejściowy projekt zespołowy - IK
  • Kierunek: Automatyka i Robotyka Elektrotechnika Informatyka Elektromobilność
  • Uwagi:Posiadanie karty graficznej Nvidii będzie atutem
Powrót