张钰枫
自动驾驶 多模态大模型 计算机视觉
博客
简历
视频理解大模型综述
2024-08-26
说明:24年6月的一篇Vid-LLM综述…
Read More
VideoPrism详解
2024-08-14
说明:Google提出的一个视频编码器可以cover各种视频理解任务?
Read More
Wolf详解
2024-08-06
说明:嗯?Wolf狼?让我瞧瞧这是个啥!
Read More
RNN详解
2024-08-03
说明:对于想要入门大模型的小白,RNN作为NLP的基础一定得要好好学啦,让我们一起学习RNN叭!
Read More
PLLaVA详解
2024-08-03
说明:起猛了,大模型能够理解视频了?来探索PLLaVA叭!
Read More
View:
User: