EN
www.lankelec.com.cn

Anthropic内部95%业务分析交给Claude,秘诀竟然不在更强模型

这篇博客的作者来自Anthropic数据科学与数据工程团队,把重复机械的取数活交给Claude后,他们腾出手,去做因果建模、预测、机器学习等事情。 一个数据模型里有几百个看着都能用的字段,背后可能藏着上百万个。你问「有多少活跃用户」,什么动作算活跃?算不算欺诈账号?回溯窗口取7天还是30天?模型在这堆近义选项里,挑不出对的那个。 数据源、业务定义、表结构天天在变。模型脑子里的知识慢慢「生锈」,开始返回「细微处出错」的答案。这种错最难发现,看着全对,其实早就不对了。 把它和写代码对比,差别一下就清楚了。写代码是开放题,文档和单元测试天然挡着幻觉。数据分析往往只有一个正确答案、一个正确来源,而且没有任何确定性的办法证明它对。 第一层,数据基础层(data foundations):数据仓库本身,包括数据模型、转换、测试、表,以及描述它们的元数据。核心动作是把同一个概念收敛到唯一一张权威表,专治「概念-实体歧义」,同时也构建了预防数据口径过时的第一道工程防线。 第二层,事实来源(sources of truth):模型查数时参照的几个权威来源,按可信度从高到低是:语义层>血缘与转换图>查询语料>业务上下文。它的作用就是把用户嘴里模糊的问法,翻译成系统里唯一正确、有人维护的数据口径。 第四层,验证(validation):离线评测、消融实验、在线验证,再加上维护流程,查出三类错里还有哪一类在漏,也是对抗「数据过时」的主要方式。 他们试过让大模型自动从原始表生成指标定义,结果生成的定义把想消除的歧义又原样编码了回去,在评测里直接成了负分。最后只能改回老办法:Claude起草文档,定义由人来拍板。 事实来源是声明式知识,告诉模型每个指标是什么意思;Skills是程序性知识,告诉它先查哪、按什么顺序查、一份合格分析长什么样。 于是Anthropic团队就把维护当成正经工程来做:Skill文档和数据模型塞进同一个代码仓库,改模型的那个代码合并请求(PR),顺手把对应文档也改了。现在约90%的数据模型改动,都带着一处Skill更新一起提交。 给智能体开了全文检索(grep)权限,让它去翻历史SQL文件,还在运行记录里确认它确实一条条读了。结果准确率上下波动不到1个点。更要命的是,答错的那些题里,约80%的正确答案,其实就躺在它刚读过的语料里。它看见了,还是没用上。

新闻配图
法官介绍,两人确立恋爱关系后,杨女士和王先生的聊天记录一天能达一两百条,内容除了杨女士对王先生表达爱意外,再就是变相诱导他进行大额打赏。今年早些时候,利物浦俱乐部邀请了球迷、前球员、记者以及俱乐部评审团进行投票,共同评选并确定截至2026年的“利物浦队史百大球星”的最终排名。宿主被系统灌溉的日常小说临安百度15岁的孙心然在1/4决赛的比赛当中,6-0/6-2轻取6号种子齐韦特科维奇,顺利跻身女单四强。孙心然成为了第2位在法网青少年组闯入四强的中国选手,此前唯一一人是2019年的郑钦文。在单打结束后不久,孙心然同张瑞恩搭档,闯入到了女双四强。此次裁员波及招聘及各类人力资源岗位。Uber 并未公布具体裁员人数,但这家网约车巨头的发言人透露,本次被裁人员占其 3.4 万名全体员工总数的远不足 1%。
20260702 👠 她一直被粉丝调侃是“随时可能倒下的身体透支狂”,但这次却被称为“最清醒的女演员”。不是因为她低调不谈恋爱,未来一年都不打算上综艺,而是因为她把“身体”这个事维护得比剧本还认真。《双管齐下》金银百度在更新了英超球员的身价之后,德转还列出了目前德国身价最高的12名球员,维尔茨此次身价下跌1000万欧元,但仍以1亿欧元与穆西亚拉并列德国球员第一。
新闻配图
📸 单瑞兴记者 谢启雁 摄
20260702 👄 金融资源下沉成效体现在了数据方面。金融监管总局披露数据显示,截至2026年2月末,全国普惠型涉农贷款余额14.52万亿元,同比增长10.34%;2026年前两个月新发放的普惠型涉农贷款平均利率4.05%,同比下降0.46个百分点。九一麻花传剧免费观看百度网盘用户可点击感兴趣的故事深入浏览,应用还会调取网络公开信息辅助决策,例如导航至最近的遛狗公园或推介宠物训练课程。用户可将喜欢的内容保存至个人库,并随时回顾。
新闻配图
📸 陈桂禄记者 孙桂华 摄
🩲 这是针对日本和菲律宾单方面宣布启动中国台湾岛以东海域划界谈判、严重侵犯中国领土主权和海洋权益采取的必要行动。美国烈火干柴1983
.   . -->

trap

扫一扫在手机打开当前页
  trap   -->

trap