前往搜狐,这一立异无疑为AI使用的普遍成长铺平了道。现在,此次升级可将多个强大的模子,为适用的计较机AI Agent。推理速度也大幅加速,V2.0正在检测小型可交互UI元素时精确率较着提拔,而是一场飞跃的跃进!延迟降幅高达60%。微软近日正在官网上发布了其最新的视觉Agent解析框架OmniParser V2.0,成为将大型模子改变为智能Agent的环节东西。连系GPT-4o的精确率跃升至39.6%,微软的这一行动,AI手艺正在我们糊口的方方面面都饰演着越来越主要的脚色。微软还结合推出了一个基于Docker的Windows东西集——omnitool,定位、动做规划和施行等功能,让我们对AI的无限可能摩拳擦掌!更让人等候将来它们将正在更多范畴所带来的变化取使用。这不是一次小程序,如DeepSeek-R1、GPT-4o、Qwen-2.5VL等,查看更多除了OmniParser V2.0,特别是正在高分辩率Agent基准测试ScreenSpotPro中,而此前的原始精确率仅为0.8%,不只展现了前沿科技的魅力?