阿里云通义千问发布Qwen2.5-VL视觉模型,视觉理解能力领跑行业,全面超越GPT-4

1月28日,阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,在多项权威评测中夺得视觉理解冠军,表现超越GPT-4和Claude3.5。该模型能够更精准地解析图像内容,展现了强大的视觉理解能力。

此外,Qwen2.5-VL突破性支持长达1小时的视频理解,无需微调即可变身为AI视觉智能体,实现给朋友送祝福、电脑修图、手机订票等多步骤复杂操作,展现了广泛的应用潜力。

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!