CogVLM2 | Lab Index

Next-generation vision-language model. CogVLM2-Video introduced multi-frame time localization for precise video understanding.

No results found