🔍 技术特点: DreamTalk利用扩散模型生成高质量动画,实现逼真嘴唇动作和丰富表情,支持多语言同步,可用于不同场景和环境。
数据质量将使性能提升10倍。
最初的AI设备可能不是智能手机。我们已经看到一些新型移动设备的例子,这些设备使AI成为核心,而不是像今天的智能手机那样将其视为事后的想法。Humane的Ai Pin是一款售价699美元的设备,可以进行对话并进行实时语言翻译。有报道称前苹果设计师Jony Ive、OpenAI的Sam Altman和软银的Masayoshi Son已联手讨论创建某种AI设备。
一家大型AI公司在一轮(或类似)投资中表现令人失望,部分原因是投资者担心侵犯版权。
2、LLaVA、CogAgent和BakLLaVA是三种具有极大潜力的开源视觉语言模型。