1月28日,阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,在多项权威评测中夺得视觉理解冠军,表现超越GPT-4和Claude3.5。该模型能够更精准地解析图像内容,展现了强大的视觉理解能力。
此外,Qwen2.5-VL突破性支持长达1小时的视频理解,无需微调即可变身为AI视觉智能体,实现给朋友送祝福、电脑修图、手机订票等多步骤复杂操作,展现了广泛的应用潜力。
2025-02-06 18:12:29 来源:网易 编辑:霍瑗睿
1月28日,阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,在多项权威评测中夺得视觉理解冠军,表现超越GPT-4和Claude3.5。该模型能够更精准地解析图像内容,展现了强大的视觉理解能力。
此外,Qwen2.5-VL突破性支持长达1小时的视频理解,无需微调即可变身为AI视觉智能体,实现给朋友送祝福、电脑修图、手机订票等多步骤复杂操作,展现了广泛的应用潜力。