EN
www.youquhui.com

收评,阿里发布Qwen3.7-Plus:屏幕理解跑赢GPT-5.4,11小时独立开发App,“看、想、写、做”打通了!

6月2日,阿里云通义千问团队在X平台正式宣布发布Qwen3.7-Plus。这是一个多模态Agent模型,官方表述是“将视觉与语言统一为一体化智能体基座”。 用Qwen3.7-Plus做App、复刻股票应用不在话下。千问官方博客披露,基于Qwen3.7-Plus构建的Hybrid-Agent系统,曾连续稳定运行11小时以上,自动完成一款英语单词学习App的完整研发闭环。Hybrid-Agent系统还自主完成了macOS原生Stocks股市应用的高保真复刻。而模型屏幕理解得分79,也超过GPT-5.4和Gemini-3.1 Pro。 而千问这次发布的时间点颇为微妙。就在前一天,MiniMax刚刚推出新一代旗舰开源模型M3,宣称同时实现顶尖编程能力、1M超长上下文与原生多模态。两家在同一周内密集发布,国内大模型开源竞赛愈发白热化。 官方博客描述,这个模型能"感知真实世界场景、读取屏幕并操作GUI、基于视觉参考生成代码、端到端导航移动应用",并在单一智能体循环中无缝融合GUI与CLI交互。 这里有两个关键词:GUI和CLI。GUI就是图形界面,比如网页按钮、手机App菜单、桌面软件窗口。CLI就是命令行,比如工程师用来安装依赖、运行测试、部署服务的黑色窗口。 比如,它可以读取屏幕,理解手机App或网页界面里哪个按钮该点;也可以看一张设计图,然后生成SVG、网页或前端原型;还可以在命令行里跑代码、看报错、再改代码。 细节包括:生成代码超过10000行,触发Agent调用超过1000次,覆盖需求文档生成、代码自动编写、自动化安装部署、测试用例创建、GUI自动化测试、多场景并行测试、产品说明自动更新和版本迭代。 这个案例的关键点不在于“写了多少代码”,而在于链路够长。一个真实软件任务往往不是一次生成代码就结束,还要安装、运行、测试、改Bug、再验证。官方演示想强调的正是这种长流程能力。 Qwen官方博客称,Hybrid-Agent系统自主完成了macOS原生Stocks股市应用的高保真复刻。流程包括:交互原生应用并理解UI布局和功能细节,基于交互记录生成SwiftUI源码,接入LongBridge真实行情API获取实时市场数据,自动编译构建并启动复刻应用。 模型自主执行了10项功能验证测试,内容包括实时行情加载、股票选择与切换、多周期视图切换、搜索过滤和详细数据面板展示等,且全部通过。 这个演示更直观:模型不是只生成一个静态页面,而是要理解行情App的结构、数据源和交互逻辑,再把它做成一个可以运行的桌面应用。 在图像/视频转SVG任务中,模型需要识别几何结构、颜色、布局、层级关系和动态变化,再用代码表达出来。对于图标、插画、动效、图形设计和信息可视化,这类能力的产品价值在于:把“看见的参考图”变成“可编辑的代码资产”。 在网页设计任务中,模型不仅要复现页面风格,还要组织布局、写前端代码、处理交互逻辑,并把多模态素材整合进最终页面。 这里的流程不是“看一眼给答案”。模型会先理解图像结构和约束,再把视觉问题转成可计算的问题表示,然后自主编写并执行代码进行求解、搜索或验证。 二是Kernel Bench L3的98%——这个指标衡量的是模型优化GPU计算核心的能力,98%意味着几乎所有问题都能产出超越PyTorch默认编译器的方案。有用户指出,这个方向以前几乎是专业工程师的"禁区"。 MiniMax M3主打开源,技术报告和模型权重承诺在10天内公开,核心差异化是1M超长上下文(M3在1M上下文下每token计算量只有上代的1/20)和极强的长线程Agent能力(147次benchmark提交、1959次工具调用完成FP8矩阵乘优化)。 MiniMax团队让M3独立复现一篇ICLR 2025获奖论文。该任务需要看懂图文、曲线、数据和公式,也需要长上下文装入论文、代码和实验日志,还需要编程和Agent能力完成复现。M3自主运行接近12小时,最终跑通核心实验。 两者在编程Agent能力上存在直接竞争,但侧重点不同:M3更强调长上下文下的自主科研和代码优化能力,Qwen3.7-Plus更强调视觉感知与界面操作的端到端闭环。

新闻配图
关于阿森纳,罗马诺表示,今夏阿森纳会有很多情况值得关注,因为他们会围绕多名球员展开动作。在年轻球员方面,莱斯特城有一名非常有天赋的球员,值得继续关注,他就是16岁的杰里米-蒙加。IT之家注意到,vivo X500 Pro Max 已现身 GSMA 数据库,其“Pro Max”之名暗示 vivo 将在影像系统、性能等方面进一步突破极限。从数据库来看,这款手机预计将面向全球市场发售。不过考虑到智能手机行业变化极快,目前还无法确认全球发布计划是否板上钉钉。CRV1.5T小马拉大车吗 后防线上还有阿森纳后卫廷贝尔,以及费布鲁亨在布莱顿的队友范赫克。中场拥有天赋出众的弗兰基-德容,而科迪-加克波则在2022年世界杯攻入3球,大放异彩。​命运的齿轮随后在萨克拉门托转动。随着国王队主帅迈克·布朗黯然下课,福克斯对自己的职业生涯规划有了新的考量。在确认自己完全愿意在马刺担任文班亚马身边的二号人物后,里奇·保罗顺水推舟,促成了这笔改变联盟格局的交易。
20260702 🌸 该主任解释道,ICL手术具有可逆性,也就说,不合适的时候可取出,或置换晶体,但是这种情况最好不要出现。这家医院在术后发现了给她植入的晶体不合适,想重新装一枚合适的,医生是想及时补救的,因为不适配,在后期有可能会出现并发症。实事求是地说,二次手术确实会有损伤,但这是一种补救措施,和后期可能产生的并发症相比,还是利大于弊的。WWW.888055COM网站历史记录查询-百度而暑假,恰恰是补这些能力的黄金窗口期!平时上学节奏快,孩子没时间停下来补短板;40天的暑期,集中的时间、宽松的节奏,正好能帮孩子把之前落下的能力补回来,这比开学后再熬夜补作业、报一堆刷题班有用 100 倍!
新闻配图
📸 曾朝霞记者 袁东升 摄
20260702 💣 王朝网、海洋网方面,第5代混动(1.5T/1.5L)最高涨45元,涉及秦LDM-i、海豹06DM-i、唐LDM、汉LDM;第4代混动(1.5L)最高涨20元,涉及秦PLUSDM-i、宋PLUSDM-i、宋ProDM-i;第4代混动(1.5T)最高涨40元,涉及全新一代唐DM-i、汉DM-i、护卫舰07;第2/3代混动(1.5T)最高涨40元,涉及秦、宋DM、宋ProDM;第2/3代混动(2.0T)最高涨65元,涉及唐、全新一代唐DM、汉DM。西瓜视频免费技术加速主义不是资本主义未来的答案,而是资本主义未来问题本身的一部分。在资本逻辑的指导下,技术越加速,资本越集中;资本越集中,社会越分裂;社会越分裂,政治越失灵;政治越失灵,体制就会进行抚平式的治理。技术不再是危机的外部解药,而成为危机的内部机制。而技术加速主义关于“技术拯救资本主义”的叙事,最终一定会变成“技术加速资本主义崩溃”的叙事。
新闻配图
📸 佟春江记者 马国干 摄
🥵 罗宾逊右手第五掌骨曾发生骨折,官方昨日将其出战状态被列为出战成疑,这场比赛也是尼克斯自1999年之后再度闯入总决赛的首战。他们将冲击队史自1973年以来的首个NBA总冠军。昨日的公开训练课上,他完成了轻度投篮与运球练习,投篮手和右手手腕缠着黑色护带。免费的网站WWW网站/大全百度搜索
. trap -->
trap
扫一扫在手机打开当前页
spider . trap -->

trap