我基于公开API构建了一个原生Comfy Cloud移动应用

CN
2026-06-23 02:04:29

体验 Comfy Vibes 的精髓:直观的应用程序,展示而不是描述我们的平台的可能性。这些不是精美的产品,也不是数据收集工具——只是快速创作,拥抱不完美。

Subgraph Parameter Panel

理解概念之前的解释:Comfy Cloud 生成现在可以放在你的掌心——从相册捕获输入,在照片中接收输出,通过点击选择模型而不是手动输入。

Comfy Go 是我们为 SwiftUI 原生移动设备定制的 Comfy Cloud 移动应用。它简化了为手持设备定制的四种生成工作流程,不包括完整的节点编辑器。于 6 月 12 日在 TestFlight 上发布,这展示了双重可访问性:轻松使用和基础 API 灵活性——后者使前者成为可能。

可访问的功能

四条创作途径,涵盖文本/图像到图像/视频转换:

  • 文本到图像: 输入提示,选择 18 个模型,接收视觉效果

  • 图像转换: 使用相同的模型目录修改相册照片

  • 文本到视频: 自动生成动画序列,无需手动关键帧

  • 图像动画: 给静态图像注入生命

这些工作流程提供了与Web版本匹配的18个模型的访问权限。通过Comfy Sign-In即时认证。输出直接保存到您的照片库,同时应用程序库存档创建的作品。整个过程保持设备本地化-相册作为输入/输出中心,触觉模型选择。

Subgraph Parameter Panel

这涵盖了用户交互;基础设施方面将吸引开发者。

技术基础

Comfy Go 仅通过 Comfy Cloud 的公共 API 运行,相同于外部开发者访问。没有私有端点、移动设备专用通道或特权协议。每个应用程序功能都可以在外部复制。

底层 Swift SDK(ComfySwiftSDK)简化了两种核心方法和一个关键事件的交互:

Subgraph Parameter Panel

提交工作流、监控实时事件、接收输出。

  1. 初始化工作流程

  2. 跟踪作业进度(排队/运行/完成)

  3. 接收完成后输出——无需单独检索

此提交流接收序列形成整个合同。SwiftUI 组件对 HTTP 机制一无所知,只关注作业状态。每个屏幕都从这个最小 API 表面构建而成。

在 Swift 中,这转化为两个调用和状态处理:

Subgraph Parameter Panel

身份验证、提交、流式传输、输出检索。

通过 Package.swift 集成:

.package(url: "https://github.com/Comfy-Org/ComfySwiftSDK.git", from: "0.1.0")

版本 0.1.0 使用 Apache-2.0 许可,仅要求 Foundation 和 CryptoKit(iOS 17+/macOS 14+)。

这种开发可访问性具体体现在:一个开发者在约一周内创建了整个应用程序。初始脚手架于 4 月 7 日开始使用代理工作流程(Claude Code + BMAD 方法论),跨 8 个史诗和 57 个故事产生了约 17,200 行代码。结果包括功能性的 iOS 管道、模型选择、画廊和身份验证。

如此快速的发展源于 API 的极低的学习曲线。通过三个核心调用,独立开发者可以迅速实现应用程序——将概念转化为有形的产品。

真正的挑战不在于 API 的复杂性,而在于设想有价值的应用程序。

可用性

测试版访问: 通过公共 TestFlight 注册体验 Comfy Go。
开发资源:

.package(url: "https://github.com/Comfy-Org/ComfySwiftSDK.git", from: "0.1.0")

开发指标

  • 功能:跨 4 个工作流的 18 个模型

  • API 表面:提交、事件流、输出交付

  • 开发:独家开发者

  • 时间线:~1 周(4 月 7 日开始)

  • 代码量:~17,200 行

  • 方法论:Agentic 工作流程(Claude Code + BMAD)

  • API:公共 Comfy Cloud 端点

Comfy Go 是我们 Vibes 项目的成果——内部开发的项目,值得公开发布。你会用这个三步框架创造什么?在下面分享你的想法。