跳转到主要内容
Lab / 05

实验室

持续探索 AI 创作的物理边界。记录每一个假设的诞生、每一次权重的偏移,以及在混沌中沉淀出的秩序。

实验室原则:透明记录,数据共享。我们不避讳失败,因为真正的进化潜伏在 100 次偏差后的那一次全局最优解中。

Sandbox Environment

互动动效实验场

Filter Logs
进行中 ID: exp-001

Flux.1 Schnell 4步实时生成优化

Optimization
Initiated: 2026-01
72 Percent

探索 Flux.1 Schnell 在 4 步生成下的质量边界。测试不同采样器、CFG 和调度器组合,目标是在保持质量的同时将推理时间压缩至 2 秒内,实现接近实时的交互式生成体验。

Internal Logs / Progress

  • LOG_ DPM++ 2M Karras + CFG=1.5 达到最佳质量-速度平衡
  • LOG_ RTX 4090 实现 1.8秒/张(512x512),A100 达到 1.2秒
  • LOG_ INT8 量化测试完成:速度提升 40%,质量损失 <5%
  • LOG_ 当前瓶颈:VRAM 占用优化,目标降至 8GB 以下
#Flux #Schnell #Real-time #Optimization
进行中 ID: exp-002

AI 视频一致性:Flux + AnimateDiff 融合

Video
Initiated: 2025-12
58 Percent

Flux 模型与 AnimateDiff 结合生成视频时的角色/风格一致性研究。对比 IPAdapter、ControlNet、LoRA 三种方案,探索时间维度的一致性保持策略。

Internal Logs / Progress

  • LOG_ IPAdapter + LoRA 组合实现 92% 一致性(已超目标)
  • LOG_ 16帧生成:A100 45秒,优化后 28秒(加速 38%)
  • LOG_ 发现:快速运动场景形变问题已通过 ControlNet Tile 修复
  • LOG_ 下一步:集成 Kontext 实现连续编辑视频生成
#AnimateDiff #Flux #Video #Consistency
已完成 ID: exp-003

小数据集训练:10图精标注 vs 50图随意

Training
Initiated: 2025-12
100 Percent

验证"精标注 > 大规模"假设:10 张精标注图片训练 Flux LoRA,能否超越 50 张随意标注的效果?核心测试数据质量与数量的平衡点。

Internal Logs / Progress

  • LOG_ ✅ 10 精标注 vs 50 随意:一致性提升 +23%,泛化能力 +18%
  • LOG_ ✅ 训练时间:A100 18分钟,成本 $0.85(RunPod Spot)
  • LOG_ ✅ BLIP-2 自动标注 + 手动修正 = 最佳质量/时间比
  • LOG_ ✅ 方法论已验证并应用于 7 个商业项目
#LoRA #Small Data #Training #Best Practice
进行中 ID: exp-004

ComfyUI 云端部署:成本与性能平衡

Infrastructure
Initiated: 2026-01
68 Percent

对比 RunPod、Replicate、Modal、Together.ai、Runware 五大云平台的 ComfyUI 部署方案。测试冷启动时间、并发处理能力、价格模型和稳定性。

Internal Logs / Progress

  • LOG_ Together.ai 价格最优:$0.0001/图(Flux Schnell)
  • LOG_ Modal 冷启动 <1秒(Replicate 3-5秒,Runware 2秒)
  • LOG_ RunPod Spot 实例性价比最高:$0.39/小时 A100
  • LOG_ Replicate 稳定性最佳:99.6% uptime,适合生产
#ComfyUI #Cloud #Cost #Infrastructure
进行中 ID: exp-005

LCM 质量评估:4步 vs 50步盲测

Performance
Initiated: 2026-02
45 Percent

系统性评估 LCM-LoRA 在 Flux/SDXL 上的质量损失。通过 FID、CLIP Score 和人类盲测,量化不同步数(2/4/8/50步)的质量差异。

Internal Logs / Progress

  • LOG_ 测试集准备完成:1000 张多样化参考图
  • LOG_ FID 初步结果:4步 vs 50步差距 <12(可接受)
  • LOG_ 人类盲测(100人):4步被识别率 62%(接近随机)
  • LOG_ 当前进展:Flux Schnell + LCM 适配器微调中
#LCM #Optimization #Benchmark #Quality
规划中 ID: exp-006

Flux Kontext 连续编辑深度测试

Editing
Initiated: 2026-02
25 Percent

FLUX.1 Kontext 的实用性验证:测试连续编辑能力边界、上下文保持轮次、与商业模型(Gemini 2.0、GPT-4o)的对比。目标是建立开源可用的编辑工作流。

Internal Logs / Progress

  • LOG_ 基础测试完成:单次编辑成功率 87%
  • LOG_ 连续编辑:3轮内一致性保持 >80%,5轮降至 65%
  • LOG_ 待测试:结合 IPAdapter 和 ControlNet 的复合编辑
  • LOG_ 目标:构建 Kontext + ComfyUI 的生产级编辑流程
#Kontext #Editing #In-Context #Production
4
Active Logs
1
Completed
1
Planning
2026
System Epoch
🔬

开放科学,共享进步

实验数据、训练日志、失败经验,我都会在适当的时候公开分享。
如果你也在做类似的研究,欢迎交流协作。