MHTI - 媒体文件刮削与整理工具

自动从 TMDB 获取剧集元数据，智能整理媒体文件

📖 项目简介

MHTI 是一个全栈 Web 应用，专为媒体文件管理设计。它能够自动解析视频文件名，从 TMDB 获取元数据，生成 NFO 文件，并智能整理媒体库，完美兼容 Emby/Jellyfin 等媒体服务器。

✨ 功能特性

功能模块	说明
🎬 文件名解析	智能解析多种命名格式（标准、中文、日文等）
🔍 TMDB 集成	自动搜索匹配，获取剧集/电影元数据
📝 NFO 生成	生成 Emby/Jellyfin 兼容的 NFO 文件
📁 文件整理	支持复制/移动/硬链接/软链接四种模式
🖼️ 图片下载	自动下载海报、背景图、剧集缩略图
📺 字幕关联	自动识别并关联同名字幕文件
👁️ 文件夹监控	实时监控文件夹变化，自动触发刮削
🔗 Emby 集成	媒体库冲突检测，避免重复
🔐 安全认证	JWT 认证，多会话管理
🌙 主题切换	支持亮色/暗色主题

🏗️ 系统架构

整体架构图

graph TB
    subgraph Client["🌐 客户端"]
        Browser[浏览器]
    end

    subgraph Docker["🐳 Docker 容器"]
        subgraph Gateway["网关层"]
            Caddy[Caddy<br/>反向代理<br/>端口 8000]
        end

        subgraph Frontend["前端层"]
            Vue[Vue 3 SPA<br/>静态文件]
        end

        subgraph Backend["后端层"]
            FastAPI[FastAPI<br/>REST API]
            WebSocket[WebSocket<br/>实时通信]
        end

        subgraph Services["服务层"]
            ScraperSvc[ScraperService<br/>刮削编排]
            TMDBSvc[TMDBService<br/>元数据获取]
            ParserSvc[ParserService<br/>文件名解析]
            NFOSvc[NFOService<br/>NFO生成]
            ImageSvc[ImageService<br/>图片下载]
            WatcherSvc[WatcherService<br/>文件监控]
            RenameSvc[RenameService<br/>文件整理]
            SchedulerSvc[SchedulerService<br/>定时任务]
        end

        subgraph Core["核心层"]
            Container[DI 容器]
            Database[(SQLite)]
            Auth[JWT 认证]
        end
    end

    subgraph External["🌍 外部服务"]
        TMDB[TMDB API]
        Emby[Emby Server]
    end

    Browser --> Caddy
    Caddy --> Vue
    Caddy -->|/api/*| FastAPI
    Caddy -->|/ws| WebSocket
    FastAPI --> Services
    WebSocket --> Services
    Services --> Core
    ScraperSvc --> TMDBSvc
    ScraperSvc --> ParserSvc
    ScraperSvc --> NFOSvc
    ScraperSvc --> ImageSvc
    ScraperSvc --> RenameSvc
    TMDBSvc --> TMDB
    Services --> Emby

服务层设计

graph LR
    subgraph Orchestration["编排层"]
        Scraper[ScraperService]
    end

    subgraph Mixins["Mixin 模式"]
        Config[ScraperConfigMixin<br/>配置管理]
        Metadata[ScraperMetadataMixin<br/>元数据处理]
        Media[ScraperMediaMixin<br/>媒体文件处理]
    end

    subgraph CoreServices["核心服务"]
        Parser[ParserService]
        TMDB[TMDBService]
        NFO[NFOService]
        Image[ImageService]
        Rename[RenameService]
        Subtitle[SubtitleService]
    end

    Scraper --> Config
    Scraper --> Metadata
    Scraper --> Media
    Config --> Parser
    Metadata --> TMDB
    Metadata --> NFO
    Media --> Image
    Media --> Subtitle
    Media --> Rename

🔄 业务流程

刮削工作流程

flowchart TD
    Start([开始]) --> Scan[扫描文件夹]
    Scan --> Filter{文件过滤}
    Filter -->|通过| Parse[解析文件名]
    Filter -->|过滤| Skip[跳过文件]

    Parse --> Extract[提取剧名/季/集]
    Extract --> Search[搜索 TMDB]

    Search --> Match{匹配结果}
    Match -->|自动匹配| GetDetails[获取详情]
    Match -->|需要选择| Manual[手动选择]
    Match -->|无结果| Failed[标记失败]

    Manual --> GetDetails
    GetDetails --> GenNFO[生成 NFO]
    GenNFO --> Organize[文件整理]

    Organize --> Mode{整理模式}
    Mode -->|复制| Copy[复制文件]
    Mode -->|移动| Move[移动文件]
    Mode -->|硬链接| HardLink[创建硬链接]
    Mode -->|软链接| SymLink[创建软链接]

    Copy --> Download[下载图片]
    Move --> Download
    HardLink --> Download
    SymLink --> Download

    Download --> Subtitle[处理字幕]
    Subtitle --> Record[记录历史]
    Record --> Success([完成])

    Failed --> Record
    Skip --> End([结束])

文件名解析流程

flowchart LR
    Input[原始文件名] --> Clean[清理垃圾信息]
    Clean --> Detect{检测格式}

    Detect -->|S01E01| Standard[标准解析器]
    Detect -->|第x集| Chinese[中文解析器]
    Detect -->|第x話| Japanese[日文解析器]

    Standard --> Extract[提取信息]
    Chinese --> Extract
    Japanese --> Extract

    Extract --> Output[剧名 + 季号 + 集号]

任务队列流程

sequenceDiagram
    participant User as 用户
    participant API as API 层
    participant Queue as 任务队列
    participant Worker as 工作进程
    participant WS as WebSocket

    User->>API: 创建刮削任务
    API->>Queue: 添加到队列
    API-->>User: 返回任务 ID

    Queue->>Worker: 分发任务
    Worker->>WS: 推送进度
    WS-->>User: 实时更新

    Worker->>Worker: 执行刮削
    Worker->>WS: 推送结果
    WS-->>User: 显示结果

📁 项目结构

MHTI/
├── 📂 server/                    # Python 后端
│   ├── 📂 api/                   # API 路由层
│   │   ├── auth.py               # 认证接口
│   │   ├── files.py              # 文件操作
│   │   ├── scraper.py            # 刮削接口
│   │   ├── config.py             # 配置管理
│   │   ├── tmdb.py               # TMDB 代理
│   │   ├── watcher.py            # 文件监控
│   │   └── websocket.py          # WebSocket
│   ├── 📂 core/                  # 核心层
│   │   ├── container.py          # 依赖注入容器
│   │   ├── database.py           # 数据库连接
│   │   ├── auth.py               # 认证逻辑
│   │   ├── middleware.py         # 中间件
│   │   └── 📂 db/                # 数据库模块
│   │       ├── connection.py     # 连接池
│   │       └── schema.py         # 表结构
│   ├── 📂 services/              # 业务服务层
│   │   ├── scraper_service.py    # 刮削编排器
│   │   ├── tmdb_service.py       # TMDB 服务
│   │   ├── parser_service.py     # 解析服务
│   │   ├── nfo_service.py        # NFO 生成
│   │   ├── image_service.py      # 图片下载
│   │   ├── rename_service.py     # 文件整理
│   │   ├── watcher_service.py    # 文件监控
│   │   ├── scheduler_service.py  # 定时任务
│   │   └── 📂 parsers/           # 解析器集合
│   │       ├── episode_standard.py
│   │       ├── episode_chinese.py
│   │       └── episode_japanese.py
│   ├── 📂 models/                # 数据模型
│   │   ├── scraper.py            # 刮削模型
│   │   ├── tmdb.py               # TMDB 模型
│   │   ├── file.py               # 文件模型
│   │   └── ...
│   └── 📂 tests/                 # 单元测试
├── 📂 web/                       # Vue.js 前端
│   ├── 📂 src/
│   │   ├── 📂 api/               # API 客户端
│   │   ├── 📂 views/             # 页面视图
│   │   │   ├── HomePage.vue      # 首页
│   │   │   ├── ScanPage.vue      # 手动任务
│   │   │   ├── HistoryPage.vue   # 刮削记录
│   │   │   ├── FilesPage.vue     # 文件管理
│   │   │   └── SettingsPage.vue  # 设置页面
│   │   ├── 📂 components/        # 组件库
│   │   │   ├── 📂 common/        # 通用组件
│   │   │   ├── 📂 layout/        # 布局组件
│   │   │   ├── 📂 scan/          # 扫描组件
│   │   │   ├── 📂 scrape/        # 刮削组件
│   │   │   └── 📂 settings/      # 设置组件
│   │   ├── 📂 stores/            # Pinia 状态
│   │   │   ├── auth.ts           # 认证状态
│   │   │   ├── scraper.ts        # 刮削状态
│   │   │   └── theme.ts          # 主题状态
│   │   ├── 📂 composables/       # 组合式函数
│   │   ├── 📂 utils/             # 工具函数
│   │   └── 📂 router/            # 路由配置
│   └── package.json
├── 📂 data/                      # 数据目录
│   └── scraper.db                # SQLite 数据库
├── docker-compose.yml            # Docker 编排
├── Dockerfile                    # 多阶段构建
├── Caddyfile                     # Caddy 配置
└── pyproject.toml                # Python 依赖

🚀 快速开始

Docker 部署（推荐）

# 克隆仓库
git clone https://github.com/your-username/mhti.git
cd mhti

# 启动服务
docker-compose up -d

# 查看日志
docker-compose logs -f

# 访问应用
# 主页: http://localhost:8000
# API 文档: http://localhost:8000/api/docs

Docker Compose 配置

version: '3.8'

services:
  mhti:
    image: xiyan520/mhti:latest
    container_name: mhti
    restart: unless-stopped
    ports:
      - "8000:8000"    # 主入口
    volumes:
      - ./data:/app/data              # 数据持久化
      - /path/to/media:/media:ro      # 媒体库（只读）
      - /path/to/output:/output       # 输出目录
    environment:
      - TZ=Asia/Shanghai
      - DATA_DIR=/app/data

开发模式

# 后端开发
cd server
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
pip install -r requirements.txt
python run_server.py --host 0.0.0.0 --port 8000

# 前端开发
cd web
pnpm install
pnpm dev

🌐 API 端点

认证模块 `/api/auth`

方法	路径	说明
POST	`/login`	用户登录
POST	`/logout`	用户登出
POST	`/register`	注册账户
POST	`/refresh`	刷新令牌
GET	`/status`	认证状态
GET	`/sessions`	会话列表

文件模块 `/api/files`

方法	路径	说明
POST	`/scan`	扫描文件夹
GET	`/browse`	浏览目录

刮削模块 `/api/scraper`

方法	路径	说明
POST	`/scrape`	执行刮削
POST	`/scrape-by-id`	按 TMDB ID 刮削
GET	`/status`	刮削状态

配置模块 `/api/config`

方法	路径	说明
GET/PUT	`/tmdb`	TMDB 配置
GET/PUT	`/proxy`	代理设置
GET/PUT	`/organize`	整理配置
GET/PUT	`/download`	下载设置
GET/PUT	`/nfo`	NFO 设置

其他模块

路径	说明
`/api/tmdb/*`	TMDB 代理接口
`/api/emby/*`	Emby 集成
`/api/watcher/*`	文件夹监控
`/api/history/*`	历史记录
`/api/scheduler/*`	定时任务
`/ws`	WebSocket 实时通信
`/health`	健康检查

🎨 前端页面

路径	页面	功能
`/`	首页	统计概览、快捷入口
`/login`	登录	用户认证
`/scan`	手动任务	创建刮削任务
`/history`	刮削记录	查看历史记录
`/files`	文件管理	浏览媒体文件
`/settings`	设置	系统配置
`/security`	安全设置	账户管理

🛠️ 技术栈

后端

技术	版本	用途
Python	3.11+	运行时
FastAPI	0.109+	Web 框架
Uvicorn	0.27+	ASGI 服务器
aiosqlite	0.19+	异步 SQLite
httpx	0.27+	HTTP 客户端
watchdog	4.0+	文件监控
python-jose	3.3+	JWT 认证
Pydantic	2.6+	数据验证

前端

技术	版本	用途
Vue	3.5+	前端框架
TypeScript	5.9+	类型系统
Vite	7+	构建工具
Pinia	3.0+	状态管理
Vue Router	4.6+	路由管理
Naive UI	2.43+	UI 组件库
Axios	1.13+	HTTP 客户端

部署

技术	用途
Docker	容器化
Caddy	反向代理
SQLite	数据存储

📊 数据库设计

核心表结构

erDiagram
    config {
        string key PK
        text value
        datetime updated_at
    }

    admin {
        int id PK
        string username UK
        string password_hash
        datetime created_at
    }

    sessions {
        string id PK
        int user_id FK
        string token
        datetime expires_at
        datetime created_at
    }

    history_records {
        string id PK
        string file_path
        string status
        string tmdb_id
        json details
        datetime created_at
    }

    scraped_files {
        string id PK
        string source_path
        string target_path
        int file_size
        int tmdb_id
        int season
        int episode
        datetime scraped_at
    }

    manual_jobs {
        int id PK
        string name
        string source_dir
        string output_dir
        string status
        datetime created_at
    }

    scrape_jobs {
        string id PK
        string file_path
        string status
        int source_id FK
        datetime created_at
    }

    watched_folders {
        int id PK
        string path
        string output_dir
        bool enabled
        datetime created_at
    }

    admin ||--o{ sessions : has
    manual_jobs ||--o{ scrape_jobs : contains
    scrape_jobs ||--o| history_records : creates
    history_records ||--o| scraped_files : records

⚙️ 配置说明

整理模式

模式	说明	适用场景
`copy`	复制文件	保留原文件
`move`	移动文件	节省空间
`hardlink`	硬链接	同分区节省空间
`symlink`	软链接	跨分区引用

环境变量

变量	默认值	说明
`DATA_DIR`	`/app/data`	数据目录
`TZ`	`Asia/Shanghai`	时区

🧪 测试

# 运行所有测试
pytest

# 运行覆盖率测试
pytest --cov=server --cov-report=html

# 运行特定测试
pytest server/tests/services/test_parser_service.py -v

📝 开发规范

代码风格

Python: Ruff + Black (line-length=100)
TypeScript: ESLint + Prettier
类型注解: 严格模式

命名约定

语言	风格
Python	snake_case
TypeScript	camelCase
Vue 组件	PascalCase

提交规范

<type>(<scope>): <description>

类型:
- feat: 新功能
- fix: 修复
- docs: 文档
- style: 格式
- refactor: 重构
- test: 测试
- chore: 构建/工具

📄 许可证

本项目采用 MIT 许可证 - 详见 LICENSE 文件。

🤝 贡献

欢迎提交 Issue 和 Pull Request！

Fork 本仓库
创建特性分支 (git checkout -b feature/AmazingFeature)
提交更改 (git commit -m 'feat: Add some AmazingFeature')
推送到分支 (git push origin feature/AmazingFeature)
创建 Pull Request

Made with ❤️ for media enthusiasts

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.github/workflows		.github/workflows
data		data
server		server
web		web
.dockerignore		.dockerignore
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
Caddyfile		Caddyfile
Dockerfile		Dockerfile
README.md		README.md
RELEASING.md		RELEASING.md
docker-compose.yml		docker-compose.yml
pyproject.toml		pyproject.toml
run_server.py		run_server.py
start.sh		start.sh

Folders and files

Latest commit

History

Repository files navigation

MHTI - 媒体文件刮削与整理工具

📖 项目简介

✨ 功能特性

🏗️ 系统架构

整体架构图

服务层设计

🔄 业务流程

刮削工作流程

文件名解析流程

任务队列流程

📁 项目结构

🚀 快速开始

Docker 部署（推荐）

Docker Compose 配置

开发模式

🌐 API 端点

认证模块 /api/auth

文件模块 /api/files

刮削模块 /api/scraper

配置模块 /api/config

其他模块

🎨 前端页面

🛠️ 技术栈

后端

前端

部署

📊 数据库设计

核心表结构

⚙️ 配置说明

整理模式

环境变量

🧪 测试

📝 开发规范

代码风格

命名约定

提交规范

📄 许可证

🤝 贡献

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 2

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

认证模块 `/api/auth`

文件模块 `/api/files`

刮削模块 `/api/scraper`

配置模块 `/api/config`

Packages