EN
www.gaoqixiehui.org.cn

阿里发布Qwen3.7-Plus:屏幕理解跑赢GPT-5.4,11小时独立开发App,“看、想、写、做”打通了!

6月2日,阿里云通义千问团队在X平台正式宣布发布Qwen3.7-Plus。这是一个多模态Agent模型,官方表述是“将视觉与语言统一为一体化智能体基座”。 用Qwen3.7-Plus做App、复刻股票应用不在话下。千问官方博客披露,基于Qwen3.7-Plus构建的Hybrid-Agent系统,曾连续稳定运行11小时以上,自动完成一款英语单词学习App的完整研发闭环。Hybrid-Agent系统还自主完成了macOS原生Stocks股市应用的高保真复刻。而模型屏幕理解得分79,也超过GPT-5.4和Gemini-3.1 Pro。 而千问这次发布的时间点颇为微妙。就在前一天,MiniMax刚刚推出新一代旗舰开源模型M3,宣称同时实现顶尖编程能力、1M超长上下文与原生多模态。两家在同一周内密集发布,国内大模型开源竞赛愈发白热化。 官方博客描述,这个模型能"感知真实世界场景、读取屏幕并操作GUI、基于视觉参考生成代码、端到端导航移动应用",并在单一智能体循环中无缝融合GUI与CLI交互。 这里有两个关键词:GUI和CLI。GUI就是图形界面,比如网页按钮、手机App菜单、桌面软件窗口。CLI就是命令行,比如工程师用来安装依赖、运行测试、部署服务的黑色窗口。 比如,它可以读取屏幕,理解手机App或网页界面里哪个按钮该点;也可以看一张设计图,然后生成SVG、网页或前端原型;还可以在命令行里跑代码、看报错、再改代码。 细节包括:生成代码超过10000行,触发Agent调用超过1000次,覆盖需求文档生成、代码自动编写、自动化安装部署、测试用例创建、GUI自动化测试、多场景并行测试、产品说明自动更新和版本迭代。 这个案例的关键点不在于“写了多少代码”,而在于链路够长。一个真实软件任务往往不是一次生成代码就结束,还要安装、运行、测试、改Bug、再验证。官方演示想强调的正是这种长流程能力。 Qwen官方博客称,Hybrid-Agent系统自主完成了macOS原生Stocks股市应用的高保真复刻。流程包括:交互原生应用并理解UI布局和功能细节,基于交互记录生成SwiftUI源码,接入LongBridge真实行情API获取实时市场数据,自动编译构建并启动复刻应用。 模型自主执行了10项功能验证测试,内容包括实时行情加载、股票选择与切换、多周期视图切换、搜索过滤和详细数据面板展示等,且全部通过。 这个演示更直观:模型不是只生成一个静态页面,而是要理解行情App的结构、数据源和交互逻辑,再把它做成一个可以运行的桌面应用。 在图像/视频转SVG任务中,模型需要识别几何结构、颜色、布局、层级关系和动态变化,再用代码表达出来。对于图标、插画、动效、图形设计和信息可视化,这类能力的产品价值在于:把“看见的参考图”变成“可编辑的代码资产”。 在网页设计任务中,模型不仅要复现页面风格,还要组织布局、写前端代码、处理交互逻辑,并把多模态素材整合进最终页面。 这里的流程不是“看一眼给答案”。模型会先理解图像结构和约束,再把视觉问题转成可计算的问题表示,然后自主编写并执行代码进行求解、搜索或验证。 二是Kernel Bench L3的98%——这个指标衡量的是模型优化GPU计算核心的能力,98%意味着几乎所有问题都能产出超越PyTorch默认编译器的方案。有用户指出,这个方向以前几乎是专业工程师的"禁区"。 MiniMax M3主打开源,技术报告和模型权重承诺在10天内公开,核心差异化是1M超长上下文(M3在1M上下文下每token计算量只有上代的1/20)和极强的长线程Agent能力(147次benchmark提交、1959次工具调用完成FP8矩阵乘优化)。 MiniMax团队让M3独立复现一篇ICLR 2025获奖论文。该任务需要看懂图文、曲线、数据和公式,也需要长上下文装入论文、代码和实验日志,还需要编程和Agent能力完成复现。M3自主运行接近12小时,最终跑通核心实验。 两者在编程Agent能力上存在直接竞争,但侧重点不同:M3更强调长上下文下的自主科研和代码优化能力,Qwen3.7-Plus更强调视觉感知与界面操作的端到端闭环。

新闻配图
勇士坐拥库里、热火手握阿德巴约两大核心,但库里已是38岁老将,阿德巴约并不擅长持球发起进攻(即便他曾单场轰下83分,这点依然成立)。皇马主席的竞选活动最初较为低调,直至上周三在梅利亚卡斯蒂利亚酒店举办的大型集会上掀起高潮。三个大厅座无虚席,逾千名支持者见证了他的候选资格发布。其中包括前球员索拉里(现任皇马足球总监)、俱乐部大使罗伯托·卡洛斯,以及罗纳尔多·纳扎里奥——在与何塞·佩德雷罗的访谈中,他开玩笑称自己为“胖罗”。“主席,您是最棒的,而且永远是最棒的!”这位巴西前锋在活动中喊道。暴躁老妈1-46集免费观看百度网盘刘先明还强调了他此前的判断,只有能做基座模型的公司,才有可能真的做到L4,自动驾驶只是小鹏基座模型落地的第一步,未来,基模还将应用到机器人、飞行汽车等更多具身载体。不过我和施老师其实是相见恨晚,如果我们早一点有这个节目,我就可以提前和施老师报告了。2023年3月6日,我们在辽宁兴城机场的滑跃起飞模拟甲板旁,就已经可以看到歼-35了。如何证明那是歼-35?第一,它旁边停了歼-15,两者大小尺寸不一样;第二,它的翼面是折起来的,空军用得着把翼面折起来吗?显然是海军舰载机的特征。
20260702 🔥 2.越秀区、荔湾区、海珠区、天河区和黄埔区,第三批次没有一所学校能稳在第三梯度线以下,最低的也只是“有机会”。意味着你第三梯度非第一志愿,选这几个区的学校就没有“稳”这一说法,无非就是机会大小的问题。疯狂丈母娘短剧全集完整版他曾被问及现代足球的发展方向,他的观点非常明确:“球员并不要求自由,他们要求的是结构。正是这种结构让他们感到自由,并能够做出自己的决定。作为教练,我们不能来到一个地方就告诉所有人‘随便踢’。如果这样做,30分钟后他们就会对我们失去耐心。他们希望我们指明方向。他们需要组织、信息、不同的选择,以及每一场比赛的充分准备。他们要求我们做大量研究。我们的工作就是把球员放在最能发挥能力的位置。”
新闻配图
📸 马才林记者 殷胜辉 摄
20260702 ✔ “所以对阿森纳来说,他肯定在名单上,但阿森纳并不是摩根-罗杰斯争夺战中的唯一球队。我也认为,阿森纳需要在今年夏窗考虑的多名边锋中决定谁是他们最想要的目标。摩根-罗杰斯当然是一个选择,但他会很贵,因为他刚和维拉签下新合同。维拉将参加欧冠,维拉赢得了欧联杯,所以他们目前对自己的项目非常满意,不会轻易放走关键球员。”小南的堕落浮殇TXT百度云网盘范赫克此前在布莱顿与德泽尔比建立了良好关系,不过他用了超过一个赛季的时间,才说服这名意大利教练相信自己已经准备好在球队占据位置。2023-24赛季,也就是德泽尔比执教布莱顿的最后一个赛季,范赫克成为球队常规主力,当时布莱顿还参加了欧联杯。此后两个赛季,在许尔策勒执教期间,范赫克只缺席了6场英超比赛。
新闻配图
📸 罗成华记者 韩树林 摄
💣 那么对于明年的目标呢?当然这一年已经非常不可思议了,但你们是想再次赢得意甲冠军吗?还是在欧冠走得更远?你现在已经进入休假阶段,但你们已经开始考虑下赛季了吗?叔叔来教你1—80集免费观看全集百度
.   trap --> trap
扫一扫在手机打开当前页
trap spider   -->
trap