阿里云通义千问发布Qwen2.5-VL视觉模型，视觉理解能力领跑行业，全面超越GPT-4

2025-02-06 18:12:29 来源：网易编辑：霍瑗睿

1月28日，阿里云通义千问开源了全新的视觉模型Qwen2.5-VL，在多项权威评测中夺得视觉理解冠军，表现超越GPT-4和Claude3.5。该模型能够更精准地解析图像内容，展现了强大的视觉理解能力。

此外，Qwen2.5-VL突破性支持长达1小时的视频理解，无需微调即可变身为AI视觉智能体，实现给朋友送祝福、电脑修图、手机订票等多步骤复杂操作，展现了广泛的应用潜力。