新智元报道 编辑:桃子 LRS 【新智元导读】AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。 AI智能体离自主研发,还有多远?Nature期刊的一篇研究曾证明了,GPT-4能自主设计并开展化学实验,还能阅读文档学习如何使用实验室设备。另有Transformer作者之一研发的「世界首个AI科学家」,一口气肝出10篇论文,完全不用人类插手。如今,AI在研发领域的入侵速度,远超人类预期。来自非营利组织METR的最新研究称:同时给定2个小时,Claude 3.5 Sonnet和o1-preview在7项具有挑战性研究工程中,击败了50多名人类专家。 论文地址:https://metr.org/AI_R_D_Evaluation_Report.pdf令人印象深刻的是,AI编程速度能以超越人类10倍速度生成并测试各种方案。在一个需要编写自定义内核以优化前缀和运算的任务中,o1-preview不仅完成了任务,还创造了惊人的成绩:将运行时间压缩到0.64毫秒,甚至超越了最优秀的人类专家解决方案(0.67毫秒)。不过,当比赛时间延长至8小时,人类却展现出了明显的优势。由下可以看出,随着时间逐渐拉长,Claude 3.5 Sonnet和o1-preview的性能提升逐渐趋于平缓。有趣的是,为了获得更高的分数,AI智能体居然会违反规则「作弊」。原本针对一个任务,智能体应该减少训练脚本运行时间,o1-preview直接复制了输出的代码。顶级预测者看到这一结果惊叹道,基于这个进步速度,AI达到高水平人类能力的时间可能会比之前预计的更短。 RE-Bench设计架构,遍历七大任务 为了能够快速迭代,并以合理的成本收集数据,研究人员设定了运行限制:人类专家的评估不超过8小时,且所有环境都只能使用8个或更少的H100 GPU运行。在环境设计时,主要考虑最大化覆盖前沿AI难题,同时确保人类专家与智能体能够持续推进任务,不会遇到研究瓶颈或得分上限。RE-Bench包含了七个精心设计的评估环境,其中每个环境都提出了一个独特的机器学习优化问题,要取得高分需要大量的实验、实现和高效使用计算资源。每个评估环境包括三部分:1、评分函数(scoring function),定义了环境的目标,智能体可以随时运行该函数。每次运行评分函数时,都会在得分日志中添加一个带时间戳的事项。智能体可以看到得分日志,并检查评分函数的细节,有助于理解研究目标。2、简单但性能不佳的初始解决方案(starting solution),提供给智能体,以展示有效的解决方案是什么样子,有助于说明环境设置,可以让智能体更快地开始研究问题中更具挑战性的部分。比如说,在「优化核函数」环境中,智能体的输入为一个简单但运行缓慢的Python解决方案。3、由任务作者创建的参考解决方案(reference solution),得分很高。但该解决方案不会提供给智能体,只用于归一化得分(normalize…
新智元报道 编辑:alan 【新智元导读】扩散模型的本质竟是进化算法!生物学大佬从数学的角度证实了这个结论,并结合扩散模型创建了全新的进化算法。 扩散模型居然就是生物的进化算法! 这个结论来自「新常春藤」塔夫茨大学(Tufts University)于近日发表的一项研究: 论文地址:https://arxiv.org/pdf/2410.02543 论文的压轴大佬是美国发育和合成生物学家Michael Levin,博士毕业于哈佛大学,目前担任塔夫茨大学Allen Discovery Center主任。 Michael Levin长期从事生物电、人工生命和许多其他生物学相关主题的研究,曾在NeurIPS 2018上发表了题为「What Bodies Think About:Bioelectric Computation…
新智元报道 编辑:桃子 【新智元导读】AI编程爆火新品Windsurf诞生了,首创copilots和agents结合新范式,能够深度理解代码库,实时感知程序员的操作。 Cursor爆火之后,AI编码界好久没有再掀起这么大的风浪了。它被誉为,唯一能与Cursor匹敌的AI工具!新晋AI编程工具Windsurf,由估值12.5亿美元的美国初创公司Codeium打造,发布瞬间成为顶流。它将具备协作能力的copilots和独立能力agents相结合,创造出了全新的协作型智能体。研究人员将其称之为「Flow」。Windsurf不仅可以深度理解代码库,还配备了强大的工具集,并能实时感知用户的操作。另外,团队还开发了带来神奇体验的新功能Cascade,聊天功能进化版,能让你保持Flow State。最关键的是,不用候补,无需邀请码,所有人皆可无限制使用这款AI。Windsurf深受一些大佬的推崇,而且好评刷屏。奥特曼曾在YC的采访中,自称最敬佩Cursor团队——他们打造出了一个极具突破性的AI应用。如今,平替版Windsurf即将成为许多码农手中的利器。 新晋AI编程工具,动嘴即可开发 发布之初,背后团队演示了用新功能Cascade通过验证码。首先提出要求——如果可能的话,我希望使用PNPM React库在服务器上验证我的用户是否真实。接下来的过程中,Cascade不仅能够分析项目,分析依赖项,分析文件,还能够代表研究人员发出终端命令并建应该进行的编辑。如下视频中,完整展示了AI编码最新能力。 Cascade可以访问最广泛的工具集,比如搜索工具grep和目录列表,以及专有的基于LLM搜索工具,还能访问编辑工具,如添加和编辑文件。它甚至可以建议、执行和迭代终端命令。Cascade还能与你在IDE中的操作保持同步,只需提出简单要求——继续在文本编辑器中做更改。通过Codeium上下文感知引擎,它还能实现对生产代码库的最深入理解。这与那些只能分析从0开始的项目的AI系统有所不同。将这一切结合起来,Cascad能够在真实的代码库上进行迭代推理,以及多文件编辑。另外,Windsurf Editor还配备了各种AI功能,如自动完成、超级完成、命令等。 实时适应开发者节奏,copilots和agents合二为一 如前所述,Cascade之所以让人感觉像是魔法,是因为它结合了copilot协作性质和智能体独立的强大能力。2022年之前,人类和键盘协同工作,代码开发完全是手动完成的。每一行代码都是人工输入的直接结果。2022年,LLM风靡全球,也就有了Copilots。如果你开始一行的编码,它会给出完成的建议。如果你问一个问题,你也会得到问题的答案。但由于只能调用一次LLM,它们只能完成范围有限的任务。再后来,全世界又引入了智能体的概念,它可以通过访问工具、高级推理能力自主完成整个工作流程。虽独立强大,但不会协作,甚至可能与人类做毫不相干的工作。通过Windsurf(特别是Cascade功能),研究人员在知识和工具的基础上,增加了对开发者行为的实时感知能力。这使得AI无需被告知工作范围,就能根据开发者的工作自动调整,从而实现无缝、持续的协作。从根本上说,Flow是一种与人工智能合作的新方式,创造了一种不仅实用,而且强大的用户体验。 估值12.5亿独角兽,要与微软竞争 上个月,CEO劈柴表示,谷歌超25%新代码均由AI完成。IDC估计,到2029年,AI编码工具市场规模达40亿美元。目前,市场上AI编码工具琳琅满目。今年3月,由华人团队创立的Cognition发布了世界首个AI工程师Devin,另有Anysphere发布了Cursor,现估值高达25亿美元。今年8月,Codeium完成了1.5亿美元的C轮融资,估值达到12.5亿美元。最新一轮融资由General Catalyst领投,现有投资者包括Kleiner Perkins和Greenoaks。2021年,Codeium由Varun Mohan和他儿时的朋友、MIT的Douglas Chen创立。在加入Codeium之前,Chen曾在Meta工作,帮助为Oculus…
本 文 约 6300 字 阅 读 需 要 20 分 钟 对于明朝征辽将军祖大寿而言,明崇祯二年(1629)的冬天,来得比往常要更早一些。 就在这一年十月,后金军事集团绕开了祖大寿等明朝将领守卫的辽西战线,在喀喇沁部台吉布尔喀图的带领下侵入山海关内侧。而对于后金军队的这次调动,祖大寿的探子竟然毫无察觉。 与关外相比,明廷在今天河北地区的防御系统可以说漏洞百出,致使皇太极统领的八旗铁骑如入无人之境,还顺势于遵化歼灭了一支明军劲旅。 皇太极并不满足于此,而是继续挥兵直扑北京城下,眼看局势即将失控,祖大寿一军遂在蓟辽督师袁崇焕的统率下星夜驰援北京,最终在德胜门外暂时挡住了皇太极的兵锋。 此时的北京已经入冬,寒风凛冽,严峻的战争形势,更为环境增添了几分肃杀之色。而就在袁崇焕和祖大寿二人研究下一步作战方案时,袁崇焕却突然被崇祯帝逮捕入狱并定了死罪。 = 袁崇焕被定罪的时候,祖大寿就在旁边,当他得知一直以忠勇闻名关内外的袁督师被说成了女真方面的间谍,自己心理上一时间有些难以接受,而崇祯帝变脸之快,更让他感到不寒而栗,为了防止自己也身遭不测,祖大寿和副将何可纲率领部众拔营东归。 这不啻一场兵变。…
新智元报道 编辑:Aeneas 好困 【新智元导读】UC伯克利计算机系GPA 4.0的本科生,居然毕业即失业?三四十岁的科技行业中年人,也躲不过席卷而来的裁员大潮。甚至机器学习在读博士也表示卷到飞起,看到曾经的同学,痛心直言后悔从EE转行CS。 美国学计算机的应届大学生,也是毕业即失业?这个现象,震惊了国内外读者。UC伯克利计算机系教授James O’Brien在LinkedIn上转发了华尔街日报的一篇《科技行业就业遇冷,短期内难见转机》,表示自己的学生正处于这种现状:如今的求职环境太艰难了。拥有本科学位的大学毕业生,即使表现优异,甚至GPA为4.0,也依然找不到工作。更可怕的是,在教授看来,这种情况恐怕不可逆转,以后会影响到每个领域的每个求职者。原因究竟在哪呢? 过去被疯抢的优秀学生,如今毕业即失业 曾经,UC伯克利计算机科学专业的毕业生,即使不是尖子生,也会收到多份offer,岗位、薪水、地点、雇主都十分有吸引力。但最近,许多大学生都不得不面对这样一个惨淡事实:即使拥有学位,工作也很难找。即使GPA 4.0的优秀学生,也开始向教授伸出援手。尽管他们的成绩单和简历十分漂亮,却没有得到多少工作机会。O’Brien教授猜想,这种状况还会每年持续下去——即使是今年刚开始上大学的人,四年后在找工作时也是如此。这就很可怕了。因为可用的选择有限,会有越来越多的人被解雇,未来的毕业生也会继续这种「毕业即失业」的大潮。以前,考上好大学几乎就意味着饭碗解决了,但在如今的美国,应届毕业生的就业市场竟然变得如此低迷。在教授的帖子下,不少人表示赞同:「如今美国的就业市场,可以说是处于几十年来最糟糕的时期。」求职者需要花费数月申请职位,但很多职位根本不存在;即使职位上真实的,简历也要突破AI和超符合HR部门的审核;接下来,就是和十万名竞争者厮杀,脱颖而出的人才能获得一个996的机会。一名学生说,自己GPA 3.83,辅修数学,在这一届计算机毕业生中应该算前25%了。然而自己申请了很多工作,至今还没有拿到offer,这让他十分不安。而这位同样在IT行业拥有多年经验,被裁员,而且还没找到工作的,则更加焦虑。「要是这种形势继续下去,我真的很担心短期内能否找到合适的工作机会。」一个无可争议的事实就是,找工作困难已经成为一个严峻的问题,无论是哪个专业。很多人背负着沉重的债务完成了四年大学学业,结果一毕业就是迎头痛击。在一份报告中,研究者发现,52%拥有学士学位的毕业生, 在毕业一年后从事着和学历并不匹配的工作,就算在十年后,这一比例也仅仅下降到45%。全国大学与雇主协会对雇主进行的一项调查也显示,今年大学毕业生的招聘预测低于去年。不仅是科技行业,金融、保险和房地产行业今年计划减少14.5%的招聘岗位,与去年16.7%的招聘增长形成了鲜明对比。而科技行业,形势已经尤为严峻。教授后来又补充道:科技行业的初级岗位却非常稀缺,而且竞争异常激烈,申请者中不乏能力远超岗位要求的求职者。但另一方面,部分职位则在招聘特定领域的资深人才,而要找到这样的人并非易事。如果你能够满足这些职位的要求,那么前途自然就很光明。 科技行业的工作已经消失? O’Brien教授转发的这一篇文章,给出了一个惊人的结论——科技行业的工作,如今正在消失,而且短期内不会恢复。数据显示,自2020年2月以来,软件开发岗位的招聘广告数量已经下降了超过30%。Layoffs.fyi网站的报告也显示,今年科技行业的裁员潮仍在继续,自1月份以来,已有约14.8万人被裁。此外,根据Pequity的数据,2024年的薪资增长基本停滞,平均薪资仅比去年增长了0.95%。自2019年以来,中等规模的SaaS公司为初级职位提供的股权授予平均下降了55%。长期以来,科技行业在就业市场一直占据优势。而如今这种急剧的变化已经不仅是短期的不适,而是整个行业正在经历的一次根本性的劳动力需求调整,一些从业者正被市场淘汰。难怪,连三四十多岁、经验丰富的从业者都失业了,更何况大学生呢?疫情期间,科技公司大肆扩招,甚至开启了人才争夺战,招来的员工只是囤着,防止被对手招去,实际上并没有什么活儿给他们干。随着通货膨胀和利率上升,经济陷入低迷。大科技雇主开始前所未有的大规模裁员,很多次都是数以万计。 科技从业者,不再吃香喝辣 很多求职者表示,行情变了,自己已经感受到了寒气。旧金山的一位前产品经理从Meta被解雇后,连连遭受冷遇。今年春天,他开车一个小时参加面试,结果却被晾了三个小时,随后面试官只是让他完成写作测试,并没有真正进行面试。47岁的工程经理Chris Volz从90年代就在科技行业工作,去年8月被一家房地产科技公司解雇。他的感受是:「这一次感觉非常不同」。 失业的Volz用日记记录自己的求职情况以前,要么是猎头主动联系他,要么是靠内部推荐获得工作。但现在,他人际网中的几乎每个人都被解雇了,他也不得不在职业生涯中第一次主动向外投递简历。他总共申请了120多个职位,但只接到了3个电话。贷款的巨大压力快把他压垮了。好在,今年春天Volz终于做到了工作,但要求降薪5%。30岁的Kugelman年初从eBay的在线营销岗位离职,知道工作难找,干脆在曼哈顿的路灯杆上贴了自己的150份求职简历。…
新智元报道 编辑:静音 【新智元导读】今年是谷歌学术创立20周年,创始人们特意为此撰写了一篇博客,回顾了谷歌学术的成长历程,并分享了一些实用的使用技巧和背后的趣闻轶事。在AI浪潮席卷而来之际,谷歌学术将如何站稳脚跟? 全球最大、最全面的学术搜索引擎,非谷歌学术(Google Scholar)莫属。 根据网络流量测量工具Similarweb的数据,谷歌学术每月的访问量超过1亿次。 今年是它创立20周年,两位创始人Alex Verstak和Anurag Acharya特地为此撰写了一篇博客。 博客地址:https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days 博客中贴心地包含了Scholar的使用指南,还提到了不少轶闻趣事。 先让我们来看看两位创始人为我们提供了哪些Scholar的使用建议吧—— 使用tips 1. 使用AI提纲高效阅读论文 最近,谷歌学术搜索的PDF阅读器新增了AI提纲功能。 AI提纲是一种论文的扩展目录,为每个关键部分提供几条要点。浏览提纲即可快速了解论文概况。 点击某条要点即可深入阅读感兴趣的内容。…
新智元报道 编辑:乔杨 【新智元导读】几十年来,英特尔一直是硅谷占主导地位的芯片厂家。但错失大好时机,加上糟糕的执行力,让这家公司在科技行业如火如荼的AI淘金热中被迫退居观望状态。 对于从PC时代走到GenAI热潮的人,「英特尔」是一个极其割裂的存在。印象中,「英特尔」曾经代表着硅谷神话、芯片霸主,代表着最尖端的CPU技术,甚至差点收购了如今的GPU巨头英伟达。 但时移世易,2024年的英特尔收入下降、股票大跌、裁员1万5,市值徘徊在1000亿上下,仅仅是英伟达3万亿身价的零头。 一个企业的路很长,但紧要处往往只有几步。英特尔究竟是如何错过了这场GenAI热潮?他们又是在哪些关键的转折点上,做出了错误的决定? 20年前,差点收购英伟达 2005 年,这个世界还没有意识到几年后人工智能的繁荣。此时,英特尔的芯片仍然是大多数计算机中的「电子大脑」,而这家公司的董事们正面临着一个重要决定,将会改变这项变革性技术的发展轨迹。 英特尔时任CEO Paul Otellini向董事会提出了一个令人震惊的想法:收购当时以计算机图形芯片闻名的硅谷新贵——英伟达,出价高达200亿美元。 一些英特尔高管认为,图形芯片的底层设计可能成为数据中心的重要角色,这种技术路径最终将主导人工智能系统。 虽然会议是保密的,但据两位知情人士透露,董事会拒绝了这一要求。在此之前,英特尔在收购方面记录不佳,如果决定吸收掉英伟达,这笔交易将是公司迄今为止最昂贵的收购。 面对董事会的怀疑,CEO Otellini退让了,他的提议也没有被继续推进。一位参加会议的人士在事后表示,这是一个「决定性的时刻」。 如今,英伟达是无与伦比的AI芯片之王,以超过3万亿美元的市值成为了世界上身价最高的公司之一。 与此同时,曾经的半导体超级大国英特尔却步履蹒跚、陷入困境,几乎没有从AI淘金热中捞到任何油水,市值一度跌破1000亿美元。…
本 文 约 3300 字 阅 读 需 要 10 分 钟 作为数量庞大的专题庙宇之一,关帝庙已广泛分布于世界数十个国家和地区,在中国,更是有着“县县有文庙,村村有武庙”的说法。而兼有关羽诞生地与中国古建筑宝库双重身份的山西,具有得天独厚的历史人文与自然环境条件,关帝庙的数量自然不少。 “乡先生”的”身后事” 关羽,这位山西出身的武将,其一生多在流离之中度过。然而,随着时间的推移,民间和皇室的推崇使得关羽的形象逐渐升华。在这种文化氛围的推动下,关帝庙在关羽的故乡山西逐渐增多。 到了宋代,伴随着经济与文化的高速发展,关羽崇拜被官方及佛、道等宗教认可。关羽庙的建设规模逐渐扩大,许多原本信奉武神毗沙门天王的庙宇都被改为关羽庙。 在元代,宗教的兴盛促进了关公信仰的延续。随着国都从临安迁移至大都,关公信仰的中心也随之北移。在这一时期,诸如《关王事迹》等带有虚构色彩的传记,以及《三国志平话》的评书和《关大王单刀赴会》等元杂剧纷纷涌现,使得关公的形象在文献记载中愈发丰富和立体。 明洪武初期虽除去了武庙,但到了明代中期,抛开《三国演义》小说的流行不提,像《关王忠义经》等依托关公制作的经书也开始流传。不仅如此,万历时期晋升为帝的关公同样得到了“三界伏魔大帝神威远镇天尊关圣帝君”的敕封。随着《御制敕建护国关帝庙碑记》的雕刻,关公与明朝国家意志紧密地结合在了一起。 而伴随清朝全盘承袭明制,关羽崇拜也走向顶峰。为使关帝庙建筑统一,清政府将关帝庙的规制写入《清会典》当中。在已有关庙得到修缮或重建的同时,新的关帝庙也被大量建立起来,造成了如今我们看到的关帝庙大多来源于明清时期的局面。从顺治、雍正、乾隆再到同治、光绪等众多皇帝的助推下,关羽完成了“忠义神武灵佑仁勇威显护国保民精诚绥靖佑赞宣德关圣大帝”的加封,还对其祖上、后裔进行加封,真正完成了“赠官、赐谥、立庙、建祠、福荫后裔”一系列褒恤仪式。…