Lab / 05

实验室

持续探索 AI 创作的物理边界。记录每一个假设的诞生、每一次权重的偏移，以及在混沌中沉淀出的秩序。

实验室原则：透明记录，数据共享。我们不避讳失败，因为真正的进化潜伏在 100 次偏差后的那一次全局最优解中。

Sandbox Environment

互动动效实验场

Parameter Tuning: Active

Filter Logs

进行中 ID: exp-001

Flux.1 Schnell 4步实时生成优化

Optimization

Initiated: 2026-01

72 Percent

探索 Flux.1 Schnell 在 4 步生成下的质量边界。测试不同采样器、CFG 和调度器组合，目标是在保持质量的同时将推理时间压缩至 2 秒内，实现接近实时的交互式生成体验。

Internal Logs / Progress

LOG_ DPM++ 2M Karras + CFG=1.5 达到最佳质量-速度平衡
LOG_ RTX 4090 实现 1.8秒/张（512x512），A100 达到 1.2秒
LOG_ INT8 量化测试完成：速度提升 40%，质量损失 <5%
LOG_ 当前瓶颈：VRAM 占用优化，目标降至 8GB 以下

#Flux #Schnell #Real-time #Optimization

进行中 ID: exp-002

AI 视频一致性：Flux + AnimateDiff 融合

Video

Initiated: 2025-12

58 Percent

Flux 模型与 AnimateDiff 结合生成视频时的角色/风格一致性研究。对比 IPAdapter、ControlNet、LoRA 三种方案，探索时间维度的一致性保持策略。

Internal Logs / Progress

LOG_ IPAdapter + LoRA 组合实现 92% 一致性（已超目标）
LOG_ 16帧生成：A100 45秒，优化后 28秒（加速 38%）
LOG_ 发现：快速运动场景形变问题已通过 ControlNet Tile 修复
LOG_ 下一步：集成 Kontext 实现连续编辑视频生成

#AnimateDiff #Flux #Video #Consistency

已完成 ID: exp-003

小数据集训练：10图精标注 vs 50图随意

Training

Initiated: 2025-12

100 Percent

验证"精标注 > 大规模"假设：10 张精标注图片训练 Flux LoRA，能否超越 50 张随意标注的效果？核心测试数据质量与数量的平衡点。

Internal Logs / Progress

LOG_ ✅ 10 精标注 vs 50 随意：一致性提升 +23%，泛化能力 +18%
LOG_ ✅ 训练时间：A100 18分钟，成本 $0.85（RunPod Spot）
LOG_ ✅ BLIP-2 自动标注 + 手动修正 = 最佳质量/时间比
LOG_ ✅ 方法论已验证并应用于 7 个商业项目

#LoRA #Small Data #Training #Best Practice

进行中 ID: exp-004

ComfyUI 云端部署：成本与性能平衡

Infrastructure

Initiated: 2026-01

68 Percent

对比 RunPod、Replicate、Modal、Together.ai、Runware 五大云平台的 ComfyUI 部署方案。测试冷启动时间、并发处理能力、价格模型和稳定性。

Internal Logs / Progress

LOG_ Together.ai 价格最优：$0.0001/图（Flux Schnell）
LOG_ Modal 冷启动 <1秒（Replicate 3-5秒，Runware 2秒）
LOG_ RunPod Spot 实例性价比最高：$0.39/小时 A100
LOG_ Replicate 稳定性最佳：99.6% uptime，适合生产

#ComfyUI #Cloud #Cost #Infrastructure

进行中 ID: exp-005

LCM 质量评估：4步 vs 50步盲测

Performance

Initiated: 2026-02

45 Percent

系统性评估 LCM-LoRA 在 Flux/SDXL 上的质量损失。通过 FID、CLIP Score 和人类盲测，量化不同步数（2/4/8/50步）的质量差异。

Internal Logs / Progress

LOG_ 测试集准备完成：1000 张多样化参考图
LOG_ FID 初步结果：4步 vs 50步差距 <12（可接受）
LOG_ 人类盲测（100人）：4步被识别率 62%（接近随机）
LOG_ 当前进展：Flux Schnell + LCM 适配器微调中

#LCM #Optimization #Benchmark #Quality

规划中 ID: exp-006

Flux Kontext 连续编辑深度测试

Editing

Initiated: 2026-02

25 Percent

FLUX.1 Kontext 的实用性验证：测试连续编辑能力边界、上下文保持轮次、与商业模型（Gemini 2.0、GPT-4o）的对比。目标是建立开源可用的编辑工作流。

Internal Logs / Progress

LOG_ 基础测试完成：单次编辑成功率 87%
LOG_ 连续编辑：3轮内一致性保持 >80%，5轮降至 65%
LOG_ 待测试：结合 IPAdapter 和 ControlNet 的复合编辑
LOG_ 目标：构建 Kontext + ComfyUI 的生产级编辑流程

#Kontext #Editing #In-Context #Production

4

Active Logs

1

Completed

1

Planning

2026

System Epoch

🔬

开放科学，共享进步

实验数据、训练日志、失败经验，我都会在适当的时候公开分享。
如果你也在做类似的研究，欢迎交流协作。

联系协作查看洞察