自原作者 @zhengxinlan1995-code 的 2.6.1 版本以来,使用 Antigravity 从原始版本 2.6.1 到 3.7.36c(截至 2026-01-14)共经历 126 次 快速迭代与修复(含 73 个公开版本号及 53 次内部逻辑微测),包含 5 个 里程碑版本与 三次 重构。目前已进化为功能完善的工作流设计生产平台。
相比于原始项目,我们在以下方面进行了重大改进:
- 工程化重构: 将原始单 HTML 架构利用 Vite + React 进行现代化重构,提升了 10 倍以上的加载速度。
- 黑名单与容错机制: 实现了多 API Key 智能轮换,自动拉黑积分耗尽(1006)或失效的 Key,确保大规模生成任务不中断。
- 智能分镜系统 (Smart Storyboard): 开发了完整的可视化分镜编辑器,支持批量生成、首尾帧控制、多图参考及实时预览。
- 性能专项优化: 针对超大规模节点图和数千条历史记录进行了渲染优化,支持“极致”性能模式。
- 数据持久化: 彻底解决了 Blob URL 失效问题,所有资产自动同步至本地存储,支持 ZIP 批量导出。
请根据您的需求选择使用最合适的版本:
- 文件名:
Tapnow Studio-V3.7.36c.html - 版本号: v3.7.36c (2026-01-14)
- 主要更新:
- ✅ 智能分镜计时器功能: 0.1s 级刷新更顺滑,任务完成/失败停表并保留耗时,重生成从 0 开始。
- ✅ 锁定镜头批量修复(继承 V3.7.31):锁定镜头不再进入批量队列。
- ✅ 预览回填修复(继承 V3.7.30):分镜生成后预览图稳定回填。
- ✅ 1006 错误修复:积分不足与错误码判定更准确,减少误判与重复请求。
- ✅ 支持首尾帧:视频模式下首尾帧输入与显示稳定可用。
- ✅ 本地缓存回退:预览链路 localCache > thumbnail > original。
- ✅ 本地保存去重:同图按子文件夹隔离查重。
| 版本 | 迭代次数 | 标题 | 核心特性 |
|---|---|---|---|
| V3.7.34 | MILESTONE | Timer Stabilized | 计时器 0.1s 刷新与完成停表,耗时稳定保留。 |
| V3.7.31 | 5 次 | Logic stability | 极致修护批量生成过滤与键盘导航。 |
| V3.7.30 | 5 次 | State Sync | 根治预览不回填与 UI 加载显示延迟。 |
| V3.7.29 | 7 次 | Stability Fix | 引入竞态锁定与三选项任务控制。 |
| V3.7.20 | MILESTONE | Provider 重构 | 统一了即梦 (Jimeng) 全系列模型的 Provider 配置架构。 |
| V3.6.0 | MILESTONE | 智能分镜重构 | 引入了双渠道架构和全新的分镜编辑器 UI。 |
| V3.5.20 | MILESTONE | 性能飞跃 | 专项体积优化与渲染效率提升。 |
| V3.4.26 | MILESTONE | V3.4 最终版 | V3.4 系列逻辑的最稳定闭环。 |
想要查看所有细微改动、Bug 修复及技术底层的变迁,请参阅: 👉 详细版本更新纪录 (Changelog.md)
在此特别感谢原作者 zhengxinlan1995-code。正是得益于原项目优秀的灵感、扎实的架构基础以及无私的开源精神,才有了今日这个功能更强大的定制版本。向原作者的探索精神致敬!
以下信息来自原作者仓库,包含了项目的设计理念与基础功能说明。
🤖 AI-Native Project 声明
本项目是一个AI 原生 (AI-Native) 的实验性开源作品。
绝大部分核心代码、架构设计、UI 布局以及逻辑实现均在大模型 (Google Gemini) 的深度辅助下完成。 > 这是一个探索 "AI 结对编程" 极限的产物——展示了如何仅通过自然语言交互,在一个单文件 (Single HTML) 中构建出包含节点编辑器、多模态 API 调用、视频分析算法等复杂功能的现代化应用。
Tapnow Studio 是一个运行在浏览器中的可视化 AI 工作流工具。它采用“节点编辑”的交互方式(类似 ComfyUI),将当前最强大的 AI 模型能力聚合在一个无限缩放的画布上。
它的核心理念是 "轻量化" 与 "多模态协同"。整个应用被打包在一个独立的 HTML 文件中,利用浏览器原生的能力和 CDN 资源,实现了复杂的 AI 交互逻辑。
- 拖拽式连线:直观地将输入(图片/视频)流转到处理节点。
- 无限缩放:支持超大画布,利用鼠标滚轮自由缩放和平移。
- 多选与批量操作:支持框选节点,批量移动或删除。
- 实时预览:每个节点都具备独立的状态显示、进度条和结果预览。
这是 Tapnow Studio 的杀手级功能,内置了复杂的视觉处理逻辑:
- 智能抽帧 (Smart Scene Detection):内置基于像素差值的场景检测算法 (
detectScenesAndCapture),自动识别视频镜头切换并提取关键帧。 - 导演级分镜拆解:结合 Gemini 3 Pro 等多模态大模型,能够分析视频的运镜手法(推拉摇移)、主体动态、光影氛围。
- 提示词反推 (Reverse Prompting):自动将视频关键帧反推为 Midjourney (英文) 和 即梦 (中文) 的高精度提示词。
- 口播提取:自动提取视频中的语音内容并生成时间轴脚本。
- Midjourney 深度集成:
- 支持 Text-to-Image (文生图)。
- 支持 Image Prompting (垫图)。
- 支持
--oref(角色一致性) 和--sref(风格一致性) 的可视化连线配置。
- 即梦 (Jimeng) AI:
- 支持即梦 4.5 / 4.1 / 3.1 模型。
- 支持 图生图(自动处理 Base64/JSON 转换)。
- 智能分辨率适配(Auto/1K/2K/4K)。
- 其他模型:Flux, DALL-E 3 (GPT-4o Image), Nano Banana,(部分模型还没接-因为价格感觉不是很划算) 等。
支持主流视频生成模型的参数配置与任务轮询:
- Sora
- Grok-3 Video
- Google Veo
- 内置其他模型可供自行对接
- 图像对比 (Image Compare):带有滑动条合作的 AB 对比节点,方便查看原图与重绘图的差异。
- 批量素材管理:内置历史记录管理器,支持批量删除、批量重新发送到画布。
- 暗黑/明亮模式:自适应 UI 主题切换。
本项目保持了标志性的 Single-file(单文件) 架构,无需安装 Node.js 或 Python 环境。
- 下载本仓库中的
Tapnow Studio-V2.5-1.html文件。 - 双击直接使用 Chrome / Edge 浏览器打开。
- 点击右上角 API 设置 配置您的模型 Key 即可开始创作。
- 下载本仓库中的
Tapnow Studio-V2.5.html文件。 - 双击使用 Chrome, Edge 或 Safari 浏览器打开。
- 点击右上角 API 设置,配置你的模型 Key 即可开始使用。
如果你想修改代码:
- 该项目是一个单文件 React 应用,源码直接嵌入在 HTML 的
<script type="text/babel">标签中。 - 你可以直接使用 VS Code 编辑该 HTML 文件。
- 依赖库(React, Tailwind, Lucide, Babel)均通过 CDN 加载,无需
npm install。
由于浏览器安全策略(CORS)及即梦 API 的特殊签名验证,Tapnow Studio 需要配合后端代理服务使用即梦功能。
本项目完美适配开源项目 jimeng-api。
你可以选择以下任意一种方式在本地运行服务:
选项 A:下载可执行文件 (.exe) 前往 jimeng-api Releases 下载 Windows/Mac/Linux 版本并运行。
选项 B:下载已配置好的.压缩包 (.7z) JimengAPI_Release_V9_Green.7z(win版) JimengAPI_For_Mac_Users(mac版)
服务启动后,默认地址为 http://localhost:5100
- 在浏览器访问 即梦官网 (jimeng.jianying.com) 并登录。
- 按
F12打开开发者工具,点击Application(应用) 标签页。 - 在左侧栏找到
Cookies,点击即梦的域名。 - 复制
sessionid的值。
- 打开 Tapnow Studio 右上角的 API 设置。
- 找到 Jimeng 相关的模型配置(或添加新模型)。
- Base URL 填入:
http://localhost:5100。 - API Key 填入:刚才复制的
sessionid。 - (可选) 勾选设置底部的“即梦图生图使用本地文件”以获得更好的上传稳定性。
Tapnow Studio 展示了现代前端技术在无构建工具(No-Build)环境下的极限能力:
- Runtime: 浏览器原生 ES Modules + Babel Standalone 实时编译 JSX。
- UI Framework: React 18 (UMD)。
- Styling: Tailwind CSS (Script Tag 注入)。
- State Management: React Hooks (
useMemo,useCallback,useRef) 实现高性能画布渲染。 - Storage:
localStorage实现数据持久化(API Key、历史记录、画布状态)。 - Network: 原生
fetchAPI 处理 Server-Sent Events (SSE) 和长轮询。
功能描述: 支持连接本地服务器以接管资源管理,大幅提升加载速度并节省带宽。
- 连接配置:默认支持连接
http://127.0.0.1:9527,提供可视化连接状态面板。 - 智能缓存:
- 自动缓存角色库图片及历史记录中的媒体文件。
- 内置去重机制,智能检测已存在文件,避免重复下载。
- 加载加速:资源加载时优先调用本地缓存 URL,实现秒级预览。
功能描述:
新增 local-save 节点,打通工作流与本地文件系统的存储通道。
- 自动保存:开启后自动将上游图片/视频存入本地,支持批量处理与自动去重。
- 格式转换:自动将 PNG 转换为高质量 JPG 格式,优化存储空间。
- 自定义配置:支持设置保存子文件夹路径,实时反馈服务器连接状态。
- 操作模式:支持全自动流式保存与手动触发保存。
功能描述: 引入小说创作辅助工具链,实现从文本到视觉要素的自动提取。
- 小说输入节点 (
novel-input):- 支持最大 10,000字 文本输入,配备实时字数统计。
- 一键生成分析下游节点。
- 提取角色和场景节点 (
extract-characters-scenes):- 角色提取:自动解析姓名、身份、外貌描述、年龄、性别等元数据。
- 场景提取:智能识别场景名称与环境描述。
- 可视化:分类展示提取结果,支持多模型选择与实时进度显示。
功能描述: 增强了工作流的便携性与复用性。
- 局部导出:支持仅保存当前选中的节点和连接为工作流文件(V2.6 版本)。
- 流式处理:采用 Blob 转 Base64 及流式写入技术,轻松处理大型工作流导出。
- 智能导入:
- 支持 JSON 格式导入并追加到当前画布。
- 导入时智能匹配本地库文件,优先复用本地资源而非 Base64 数据。
功能描述: 针对历史记录列表引入分级性能策略,解决长列表卡顿问题。
- 三种模式:
- 极速模式:生成 80px 缩略图 (JPEG 质量 0.3),极致流畅。
- 普通模式:生成 150px 缩略图 (JPEG 质量 0.6),平衡清晰度与性能。
- 关闭:显示原图。
- 批量处理:支持 Midjourney 多图缩略图生成,采用分批处理(每次 5 个)避免阻塞主线程。
功能描述: 从底层 CSS 到交互逻辑的全方位优化。
- 交互节流:
- 画布拖动采用微型节流 (~10ms) 与
requestAnimationFrame。 - 优化多节点拖动的批量更新机制,减少重绘次数。
- 画布拖动采用微型节流 (~10ms) 与
- GPU 加速与降级:
- 节点容器启用
transform: translateZ(0)硬件加速。 - 高性能模式下自动禁用阴影、模糊与过渡动画。
- 交互过程中动态降级渲染质量,视口外媒体自动卸载。
- 节点容器启用
- 文本与线条:优化全局字体抗锯齿渲染及连接线几何精度。
- 计算结果缓存:优化连接输入(图片/视频)的计算缓存,减少重复运算。
- 缩略图 Map:构建内存级 Map 索引缓存缩略图 URL,防止重复生成。
- 加载优先级策略:
- 本地缓存文件 (Local Cache)
- 性能模式缩略图 (Thumbnail)
- 原始网络 URL (Original)
❤️ 欢迎各路大佬协助更新
- AI Architecture: 本项目的核心逻辑、UI 组件及架构设计由 Gemini 辅助完成。
- Jimeng Support: 即梦接口支持由 iptag/jimeng-api 提供,这是一个非常棒的逆向工程项目。
- Icons: 使用 Lucide 图标库。
本项目仅供学习与技术研究使用。
- 请勿将本项目用于任何非法用途。
- 使用即梦、Midjourney 等服务时,请遵守相应服务商的使用条款。
- 用户需自行管理 API Key,本项目不会上传任何 Key 到云端。
本项目采用 GNU General Public License v3.0 (GPLv3) 开源协议。
这意味着:
- ✅ 你可以免费使用、复制、修改和分发本项目。
- ✅ 你可以将本项目用于商业用途。
⚠️ 但是,如果你修改了本项目并发布(分发),你必须开源你的修改代码,并同样使用 GPLv3 协议。- 🚫 你不能将本项目闭源后作为商业软件出售。