阿里巴巴开源项目DreamTalk,能让人物头像栩栩如生地说话,支持多语言、歌曲、嘈杂音频匹配,开放更多开发者创新。
2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
如果真是这样的话,Agent的开发会重新蓬勃发展。可以自动化工作流程、与其他Agent交互并随着时间的推移变得更好的Agent。
与2022年深陷“擦边”质疑不同,2023年,椰树的直播从美女跳舞转为主打猛男跳舞,最终不仅实现了口碑逆袭,收获了大批粉丝,旗下主播“KK战神”“欢欢一口甜”“启子”也成为了小有名气的网红。
看上去,这种「简单的美好」很容易实现,但为何其他游戏难以复刻?事实上,这背后有着多个结实的骨架在支撑着。