Web & CLI εργαλείο που διορθώνει θορυβώδες OCR κείμενο (π.χ. 0->o, 1->l, 5->s) χρησιμοποιώντας fine-tuned T5.
Περιλαμβάνει annotation UI, data generation, training script, και web inference με πολλαπλούς υποψήφιους και confidence scores.
- Διόρθωση OCR λαθών σε Αγγλικά κείμενα
- Web UI και Command-line interface
- Training pipeline με synthetic data
- Πολλαπλοί υποψήφιοι με confidence score
Enter noisy text: th1s 1s a t3xt w1th 0cr err0rs! Fixed: This pipeline exports and trains a model.
Enter noisy text: we1c0me t0 the neW pr0ject Fixed: We are testing our OCR fixer project.
Enter noisy text: the qu1ck br0wn f0x jump5 0ver the l4zy d0g Fixed: The quick brown fox jumps over the lazy dog. Installation
git clone https://github.com//OCRfixer.git cd OCRfixer pip install -r requirements.txt Usage CLI
python demo.py Web UI
python app.py Then open http://127.0.0.1:5000/fix in your browser.
