多模态数据处理项目

项目简介

这是一个多模态数据处理项目，支持处理PDF、TXT、DOC文档以及PNG、JPG等图片格式文件。项目使用本地部署的Qwen2.5-vl-72b等多模态模型来提取图片中的文本内容。

功能特性

支持多种文件格式：PDF、TXT、DOC、PNG、JPG
多模态模型集成：支持Qwen2.5-vl-72b等本地部署模型
文本提取：从图片中提取文本内容
异步处理：支持批量文件处理
模块化设计：处理逻辑与模型服务分离

项目结构

DataProcessing/
├── src/                    # 源代码目录
│   ├── processors/         # 文件处理器
│   ├── models/            # 模型接口
│   ├── utils/             # 工具函数
│   └── main.py            # 主程序入口
├── config/                # 配置文件
├── data/                  # 数据目录
│   ├── input/             # 输入文件
│   └── output/            # 输出结果
├── logs/                  # 日志文件
├── tests/                 # 测试文件
├── requirements.txt       # 依赖包
└── README.md             # 项目说明

安装依赖

pip install -r requirements.txt

使用方法

python src/main.py --input data/input --output data/output

配置说明

在 config/settings.yaml 中配置模型服务地址和其他参数。

注意事项

确保本地多模态模型服务已启动
输入文件请放置在 data/input 目录
处理结果将保存在 data/output 目录

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
DEPLOYMENT_GUIDE.md		DEPLOYMENT_GUIDE.md
DataProcessing_github_upload.tar.gz		DataProcessing_github_upload.tar.gz
GITHUB_UPLOAD_GUIDE.md		GITHUB_UPLOAD_GUIDE.md
GIT_GUIDE.md		GIT_GUIDE.md
GIT_TUTORIAL.md		GIT_TUTORIAL.md
PROJECT_SUMMARY.md		PROJECT_SUMMARY.md
README.md		README.md
USAGE.md		USAGE.md
example.py		example.py
requirements.txt		requirements.txt
run.bat		run.bat
run.sh		run.sh
upload_to_github.sh		upload_to_github.sh
upload_when_network_fixed.sh		upload_when_network_fixed.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

多模态数据处理项目

项目简介

功能特性

项目结构

安装依赖

使用方法

配置说明

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

多模态数据处理项目

项目简介

功能特性

项目结构

安装依赖

使用方法

配置说明

注意事项

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages