2024/11/15
趁着机器现在有别的项目要跑,要跑2天半,来写个更新吧
在上个更新中的7里面写的scaling experiment取得了巨大的成功,具体表现主要是LPIPS明显低于原模型,SSIM也有所提高
从视觉效果上来讲也完爆以前的所有模型,但是代价是现在Generator有~269M参数
因为效果太好,暂时管这个模型叫aivis-1.5-large
一些收获:
1. 要降GAN loss的比例,要不然不收敛
2. SSIM饱和了,他作为bench不能很好的反应模型的提升,LPIPS饱和的情况相对小很多,但是在某个点也是会饱和的
3. AI-VIS这个task比我们想象中的更复杂,当然也因为我们的训练数据集大,因此scaling获得了很好的结果,原本的模型确实是炼到完全饱和了,所以再怎么改也没什么提升
4. 再scale一点也许还能有提升,但是不确定提升是否值得(现在在fp32推理大概需要3gb显存,虽然在cpu上推理也不慢,但是再scale要求确实会高不少)
放点图:
aivis-1.5-large vs. aivis-0.9(2023.12)


aivis-1.5-large vs. aivis-1.0(2024.5)


训练log(跑到ep200+的是老模型,没有的是新模型):
G loss:

D loss:

val SSIM:

val LPIPS:
