手写数字识别系统

这个项目使用MNIST数据集训练YOLOv8模型实现手写数字识别，并通过摄像头进行实时检测。

项目结构

.
├── data/                      # 数据集目录
│   └── with_notrans/          # 原始MNIST数据
│   └── yolo_mnist/            # 转换后的YOLO格式数据(自动生成)
├── models/                    # 模型保存目录(自动生成) mnist_digits10.pt 为训练得到的模型
├── convert_mnist_to_yolo.py   # 数据集转换脚本
├── train.py                   # 模型训练与摄像头识别脚本
└── README.md                  # 项目说明

使用方法

转换数据集

首先需要将MNIST数据集转换为YOLO格式：

python convert_mnist_to_yolo.py

训练模型并启动摄像头识别

运行以下命令开始训练并在训练完成后自动启动摄像头识别：

python train.py

实验效果

下图展示了使用摄像头进行实时手写数字识别的效果，系统能够准确识别出手写的数字并显示识别置信度。

环境依赖

本项目需要安装以下Python包：

ultralytics (YOLOv8)
torch
opencv-python
numpy
pillow

安装依赖：

pip install ultralytics opencv-python pillow numpy torch

使用说明

运行convert_mnist_to_yolo.py转换数据集，转换后的数据会保存在data/yolo_mnist目录下
运行train.py训练模型，训练完成的模型会保存在models/mnist_digits.pt
训练完成后，系统会自动启动摄像头进行实时识别
在摄像头窗口中按"q"键退出识别程序

注意事项

确保您的电脑配置有摄像头并且能够正常工作
运行前确保已安装所有必要的依赖项
对于手写数字识别，摄像头中的数字应该尽量清晰且背景简单

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
models		models
.gitignore		.gitignore
README.md		README.md
convert_mnist_to_yolo.py		convert_mnist_to_yolo.py
train.py		train.py
yolo11n.pt		yolo11n.pt
yolo8sxt.png		yolo8sxt.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

手写数字识别系统

项目结构

使用方法

实验效果

环境依赖

使用说明

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Languages

idinging/mnisttyolo8

Folders and files

Latest commit

History

Repository files navigation

手写数字识别系统

项目结构

使用方法

实验效果

环境依赖

使用说明

注意事项

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Languages

Packages