-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
開発目的
オリジナルで提供されているEasyOCRでは精度の向上が見込めないため,追加学習させる.
考えられる開発内容
1. データセットの準備
独自のデータセットを準備.各画像に対応するラベル(テキスト)を用意.
2. データローダーの作成
画像とラベルを読み込み,PyTorchのDataLoaderでバッチ処理を行う.
3. CRNNモデルの設定
EasyOCRのCRNNモデルをロードし,トレーニング用にカスタマイズ.
4. 損失関数と最適化
損失関数(例:CTCLoss)と最適化手法(例:Adam)を設定
5. トレーニングループ
モデルをトレーニングして保存.
6. モデルの使用
保存したモデルをロードし,OCRに使用.
7. EasyOCRでカスタムモデルを使用
カスタムOCRクラスを作成して,学習済みモデルを使用.
考えられる開発時間
備考
Metadata
Metadata
Assignees
Labels
No labels