Skip to content

chapterv/Tapnow-Studio-PP

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

80 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Tapnow-Studio-PP

自原作者 @zhengxinlan1995-code 的 2.6.1 版本以来,使用 Antigravity 从原始版本 2.6.1 到 3.7.36c(截至 2026-01-14)共经历 126 次 快速迭代与修复(含 73 个公开版本号及 53 次内部逻辑微测),包含 5 个 里程碑版本与 三次 重构。目前已进化为功能完善的工作流设计生产平台。

🌟 核心工作内容 (Highlights)

相比于原始项目,我们在以下方面进行了重大改进:

  • 工程化重构: 将原始单 HTML 架构利用 Vite + React 进行现代化重构,提升了 10 倍以上的加载速度。
  • 黑名单与容错机制: 实现了多 API Key 智能轮换,自动拉黑积分耗尽(1006)或失效的 Key,确保大规模生成任务不中断。
  • 智能分镜系统 (Smart Storyboard): 开发了完整的可视化分镜编辑器,支持批量生成、首尾帧控制、多图参考及实时预览。
  • 性能专项优化: 针对超大规模节点图和数千条历史记录进行了渲染优化,支持“极致”性能模式。
  • 数据持久化: 彻底解决了 Blob URL 失效问题,所有资产自动同步至本地存储,支持 ZIP 批量导出。

📅 版本历史与选择

请根据您的需求选择使用最合适的版本:

🚀 最新稳定版 (Latest Sync)

  • 文件名: Tapnow Studio-V3.7.36c.html
  • 版本号: v3.7.36c (2026-01-14)
  • 主要更新:
    • 智能分镜计时器功能: 0.1s 级刷新更顺滑,任务完成/失败停表并保留耗时,重生成从 0 开始。
    • 锁定镜头批量修复(继承 V3.7.31):锁定镜头不再进入批量队列。
    • 预览回填修复(继承 V3.7.30):分镜生成后预览图稳定回填。
    • 1006 错误修复:积分不足与错误码判定更准确,减少误判与重复请求。
    • 支持首尾帧:视频模式下首尾帧输入与显示稳定可用。
    • 本地缓存回退:预览链路 localCache > thumbnail > original。
    • 本地保存去重:同图按子文件夹隔离查重。

📁 关键里程碑版本 (Milestones)

版本 迭代次数 标题 核心特性
V3.7.34 MILESTONE Timer Stabilized 计时器 0.1s 刷新与完成停表,耗时稳定保留。
V3.7.31 5 次 Logic stability 极致修护批量生成过滤与键盘导航。
V3.7.30 5 次 State Sync 根治预览不回填与 UI 加载显示延迟。
V3.7.29 7 次 Stability Fix 引入竞态锁定与三选项任务控制。
V3.7.20 MILESTONE Provider 重构 统一了即梦 (Jimeng) 全系列模型的 Provider 配置架构。
V3.6.0 MILESTONE 智能分镜重构 引入了双渠道架构和全新的分镜编辑器 UI。
V3.5.20 MILESTONE 性能飞跃 专项体积优化与渲染效率提升。
V3.4.26 MILESTONE V3.4 最终版 V3.4 系列逻辑的最稳定闭环。

🔍 详细更新日志

想要查看所有细微改动、Bug 修复及技术底层的变迁,请参阅: 👉 详细版本更新纪录 (Changelog.md)

❤️ 特别鸣谢 (Special Thanks)

在此特别感谢原作者 zhengxinlan1995-code。正是得益于原项目优秀的灵感、扎实的架构基础以及无私的开源精神,才有了今日这个功能更强大的定制版本。向原作者的探索精神致敬!

以下信息来自原作者仓库,包含了项目的设计理念与基础功能说明。


🎨 Tapnow Studio (Original Project)


AI-Native License: GPL v3 Single File

🤖 AI-Native Project 声明

本项目是一个AI 原生 (AI-Native) 的实验性开源作品。

绝大部分核心代码、架构设计、UI 布局以及逻辑实现均在大模型 (Google Gemini) 的深度辅助下完成。 > 这是一个探索 "AI 结对编程" 极限的产物——展示了如何仅通过自然语言交互,在一个单文件 (Single HTML) 中构建出包含节点编辑器、多模态 API 调用、视频分析算法等复杂功能的现代化应用。


📖 简介 (Introduction)

Tapnow Studio 是一个运行在浏览器中的可视化 AI 工作流工具。它采用“节点编辑”的交互方式(类似 ComfyUI),将当前最强大的 AI 模型能力聚合在一个无限缩放的画布上。

它的核心理念是 "轻量化""多模态协同"。整个应用被打包在一个独立的 HTML 文件中,利用浏览器原生的能力和 CDN 资源,实现了复杂的 AI 交互逻辑。

2e8568e463c6473d89bc5be6ea5e57e8

✨ 核心功能 (Key Features)


1. ♾️ 无限画布与节点系统

  • 拖拽式连线:直观地将输入(图片/视频)流转到处理节点。
  • 无限缩放:支持超大画布,利用鼠标滚轮自由缩放和平移。
  • 多选与批量操作:支持框选节点,批量移动或删除。
  • 实时预览:每个节点都具备独立的状态显示、进度条和结果预览。

2. 🎞️ 深度视频分析与反推 (Video Intelligence)

这是 Tapnow Studio 的杀手级功能,内置了复杂的视觉处理逻辑:

  • 智能抽帧 (Smart Scene Detection):内置基于像素差值的场景检测算法 (detectScenesAndCapture),自动识别视频镜头切换并提取关键帧。
  • 导演级分镜拆解:结合 Gemini 3 Pro 等多模态大模型,能够分析视频的运镜手法(推拉摇移)、主体动态光影氛围
  • 提示词反推 (Reverse Prompting):自动将视频关键帧反推为 Midjourney (英文)即梦 (中文) 的高精度提示词。
  • 口播提取:自动提取视频中的语音内容并生成时间轴脚本。

3. 🎨 全面的 AI 绘图支持

  • Midjourney 深度集成
    • 支持 Text-to-Image (文生图)。
    • 支持 Image Prompting (垫图)。
    • 支持 --oref (角色一致性) 和 --sref (风格一致性) 的可视化连线配置。
  • 即梦 (Jimeng) AI
    • 支持即梦 4.5 / 4.1 / 3.1 模型。
    • 支持 图生图(自动处理 Base64/JSON 转换)。
    • 智能分辨率适配(Auto/1K/2K/4K)。
  • 其他模型:Flux, DALL-E 3 (GPT-4o Image), Nano Banana,(部分模型还没接-因为价格感觉不是很划算) 等。

4. 🎥 AI 视频生成

支持主流视频生成模型的参数配置与任务轮询:

  • Sora
  • Grok-3 Video
  • Google Veo
  • 内置其他模型可供自行对接

5. 🛠️ 实用辅助工具

  • 图像对比 (Image Compare):带有滑动条合作的 AB 对比节点,方便查看原图与重绘图的差异。
  • 批量素材管理:内置历史记录管理器,支持批量删除、批量重新发送到画布。
  • 暗黑/明亮模式:自适应 UI 主题切换。

🚀 如何运行 (How to Run)


本项目保持了标志性的 Single-file(单文件) 架构,无需安装 Node.js 或 Python 环境。


  1. 下载本仓库中的 Tapnow Studio-V2.5-1.html 文件。
  2. 双击直接使用 Chrome / Edge 浏览器打开。
  3. 点击右上角 API 设置 配置您的模型 Key 即可开始创作。

🚀 快速开始 (Quick Start)


方式 1:直接运行

  1. 下载本仓库中的 Tapnow Studio-V2.5.html 文件。
  2. 双击使用 Chrome, Edge 或 Safari 浏览器打开。
  3. 点击右上角 API 设置,配置你的模型 Key 即可开始使用。

方式 2:本地开发

如果你想修改代码:

  1. 该项目是一个单文件 React 应用,源码直接嵌入在 HTML 的 <script type="text/babel"> 标签中。
  2. 你可以直接使用 VS Code 编辑该 HTML 文件。
  3. 依赖库(React, Tailwind, Lucide, Babel)均通过 CDN 加载,无需 npm install

🔌 即梦 (Jimeng) API 配置指南


由于浏览器安全策略(CORS)及即梦 API 的特殊签名验证,Tapnow Studio 需要配合后端代理服务使用即梦功能

本项目完美适配开源项目 jimeng-api


1. 部署后端服务

你可以选择以下任意一种方式在本地运行服务:

选项 A:下载可执行文件 (.exe) 前往 jimeng-api Releases 下载 Windows/Mac/Linux 版本并运行。

选项 B:下载已配置好的.压缩包 (.7z) JimengAPI_Release_V9_Green.7z(win版) JimengAPI_For_Mac_Users(mac版)

服务启动后,默认地址为 http://localhost:5100


2. 获取 Session ID

  1. 在浏览器访问 即梦官网 (jimeng.jianying.com) 并登录。
  2. F12 打开开发者工具,点击 Application (应用) 标签页。
  3. 在左侧栏找到 Cookies ,点击即梦的域名。
  4. 复制 sessionid 的值。

3. 在 Tapnow Studio 中连接

  1. 打开 Tapnow Studio 右上角的 API 设置
  2. 找到 Jimeng 相关的模型配置(或添加新模型)。
  3. Base URL 填入: http://localhost:5100
  4. API Key 填入:刚才复制的 sessionid
  5. (可选) 勾选设置底部的“即梦图生图使用本地文件”以获得更好的上传稳定性。

⚙️ 技术架构 (Technical Details)


Tapnow Studio 展示了现代前端技术在无构建工具(No-Build)环境下的极限能力:

  • Runtime: 浏览器原生 ES Modules + Babel Standalone 实时编译 JSX。
  • UI Framework: React 18 (UMD)。
  • Styling: Tailwind CSS (Script Tag 注入)。
  • State Management: React Hooks ( useMemo , useCallback , useRef ) 实现高性能画布渲染。
  • Storage: localStorage 实现数据持久化(API Key、历史记录、画布状态)。
  • Network: 原生 fetch API 处理 Server-Sent Events (SSE) 和长轮询。

🚀 Tapnow Studio V2.6-1 更新日志-(2025-12-21)


✨ 新增功能


1. 本地缓存服务器 (Local Cache Server)

功能描述: 支持连接本地服务器以接管资源管理,大幅提升加载速度并节省带宽。

  • 连接配置:默认支持连接 http://127.0.0.1:9527,提供可视化连接状态面板。
  • 智能缓存
    • 自动缓存角色库图片及历史记录中的媒体文件。
    • 内置去重机制,智能检测已存在文件,避免重复下载。
  • 加载加速:资源加载时优先调用本地缓存 URL,实现秒级预览。

2. 保存到本地节点 (Local Save Node)

功能描述: 新增 local-save 节点,打通工作流与本地文件系统的存储通道。

  • 自动保存:开启后自动将上游图片/视频存入本地,支持批量处理与自动去重。
  • 格式转换:自动将 PNG 转换为高质量 JPG 格式,优化存储空间。
  • 自定义配置:支持设置保存子文件夹路径,实时反馈服务器连接状态。
  • 操作模式:支持全自动流式保存与手动触发保存。

3. 小说输入与 AI 分析

功能描述: 引入小说创作辅助工具链,实现从文本到视觉要素的自动提取。

  • 小说输入节点 (novel-input)
    • 支持最大 10,000字 文本输入,配备实时字数统计。
    • 一键生成分析下游节点。
  • 提取角色和场景节点 (extract-characters-scenes)
    • 角色提取:自动解析姓名、身份、外貌描述、年龄、性别等元数据。
    • 场景提取:智能识别场景名称与环境描述。
    • 可视化:分类展示提取结果,支持多模型选择与实时进度显示。

4. 工作流管理升级

功能描述: 增强了工作流的便携性与复用性。

  • 局部导出:支持仅保存当前选中的节点和连接为工作流文件(V2.6 版本)。
  • 流式处理:采用 Blob 转 Base64 及流式写入技术,轻松处理大型工作流导出。
  • 智能导入
    • 支持 JSON 格式导入并追加到当前画布。
    • 导入时智能匹配本地库文件,优先复用本地资源而非 Base64 数据。

5. 性能模式系统 (Performance Mode)

功能描述: 针对历史记录列表引入分级性能策略,解决长列表卡顿问题。

  • 三种模式
    • 极速模式:生成 80px 缩略图 (JPEG 质量 0.3),极致流畅。
    • 普通模式:生成 150px 缩略图 (JPEG 质量 0.6),平衡清晰度与性能。
    • 关闭:显示原图。
  • 批量处理:支持 Midjourney 多图缩略图生成,采用分批处理(每次 5 个)避免阻塞主线程。

6. 渲染引擎深度调优

功能描述: 从底层 CSS 到交互逻辑的全方位优化。

  • 交互节流
    • 画布拖动采用微型节流 (~10ms) 与 requestAnimationFrame
    • 优化多节点拖动的批量更新机制,减少重绘次数。
  • GPU 加速与降级
    • 节点容器启用 transform: translateZ(0) 硬件加速。
    • 高性能模式下自动禁用阴影、模糊与过渡动画。
    • 交互过程中动态降级渲染质量,视口外媒体自动卸载。
  • 文本与线条:优化全局字体抗锯齿渲染及连接线几何精度。

7. 缓存机制增强

  • 计算结果缓存:优化连接输入(图片/视频)的计算缓存,减少重复运算。
  • 缩略图 Map:构建内存级 Map 索引缓存缩略图 URL,防止重复生成。
  • 加载优先级策略
    1. 本地缓存文件 (Local Cache)
    2. 性能模式缩略图 (Thumbnail)
    3. 原始网络 URL (Original)

⚡ 历史更新及功能日志


❤️ 欢迎各路大佬协助更新

历史更新日志.md


🤝 致谢与声明 (Credits)

  • AI Architecture: 本项目的核心逻辑、UI 组件及架构设计由 Gemini 辅助完成。
  • Jimeng Support: 即梦接口支持由 iptag/jimeng-api 提供,这是一个非常棒的逆向工程项目。
  • Icons: 使用 Lucide 图标库。

⚠️ 免责声明 (Disclaimer)


本项目仅供学习与技术研究使用。

  • 请勿将本项目用于任何非法用途。
  • 使用即梦、Midjourney 等服务时,请遵守相应服务商的使用条款。
  • 用户需自行管理 API Key,本项目不会上传任何 Key 到云端。

📄 许可证 (License)


本项目采用 GNU General Public License v3.0 (GPLv3) 开源协议。

这意味着:

  • ✅ 你可以免费使用、复制、修改和分发本项目。
  • ✅ 你可以将本项目用于商业用途。
  • ⚠️ 但是,如果你修改了本项目并发布(分发),你必须开源你的修改代码,并同样使用 GPLv3 协议。
  • 🚫 你不能将本项目闭源后作为商业软件出售。

About

设计师随心所欲的一枚无限画布

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • HTML 85.3%
  • JavaScript 14.6%
  • CSS 0.1%