2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
2024年将是AI技术从炒作转向现实的关键时刻。以下是一些可能的趋势:
为了解决这一问题,著名人工智能教授李飞飞团队推出了Wild2Avatar,这是一种专为视频中被遮挡人物设计的神经渲染方法。
机器人成本低廉,仅为22万元,软件和硬件全部开源。
此外,M2UGen还加入了适配器和LLaMA2模型,使得该模型具备多种能力。