无标题对话

智谱清言

根据输入图像内容、视频内容和自然语言指令完成任务。