模型下载地址:https://huggingface.co/damo-vilab/dreamtalk
- 通过填充常见模式的空白,它省去了复制粘贴的需要。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。
就像我们做荣耀绿洲护眼屏,当做出突破的时候我们发现,其他厂家都会跟进,但是我觉得这种卷是一个好的现象。
图源备注:图片由AI生成,图片授权服务商Midjourney