新智元报道 编辑:定慧 【新智元导读】DeepSeek-R1是近年来推理模型领域的一颗新星,它不仅突破了传统LLM的局限,还开启了全新的研究方向「思维链学」(Thoughtology)。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程,揭示了其推理链的独特结构与优势,为未来推理模型的优化提供了重要启示。 你是否曾想过DeepSeek-R1为什么能「思考」? 距离DeepSeek-R1这只「巨鲸」引发的全球AI海啸似乎刚刚平静下来,但推理模型已经成为了AI宠儿。 不论是Gemini 2.5Pro,还是o3,o4-mini,以及所有人都在期待的DeepSeek-R2,都是推理模型。 R1的出现带火了推理模型外,也催生了一个新的研究领域:思维链学(Thoughtology)。 魁北克人工智能研究所联合麦吉尔大学和哥本哈根大学最近发布了这一研究领域的详细研究,这份长达142页的报告深入探讨了R1的思维链。 同时这份研究报告也登上了HuggingFace的Daily Papers。 论文地址:https://arxiv.org/pdf/2504.07128 研究团队从DeepSeek-R1推理的基本构件出发,分析其推理链的长度对性能的影响、对长或混乱上下文的处理能力、安全性和文化问题、以及它在人类类比语言处理和世界建模中的表现。 研究报告涵盖了多个独特的维度:安全性、世界建模、忠诚度、长情境等。 研究结果发现几个关键亮点: DeepSeek-R1 存在一个「推理甜点区」(sweet…
新智元报道 编辑:定慧 英智 【新智元导读】AI会无脑附和吗?Anthropic研究发现,Claude能根据场景切换人格:谈恋爱时化身情感导师,聊历史时秒变严谨学者。一些对话中,它强烈支持用户价值观,但在3%的情况下,它会果断抵制。 想象一下,如果能「偷听」70万次AI和人类的私密对话(别担心,是匿名的),会发现什么? AI仅仅是个概率机器,还是一个善于隐藏自己真实性格的——等会,AI真的有性格吗? 也许说性格不合适,现阶段的AI智能或许用「价值观」来形容最为合适。 毕竟,在见识到AI的实力后,各大巨头天天喊着要「与人对齐」,生怕AI价值观走偏,把人给灭了,但是背地里谁都顾不上,都在疯狂的内卷训练新模型。 2025年刚过去不到4个月,就已经发布了众多大模型 但就在刚刚,AI公司Anthropic倒是花时间干了一件挺符合他们价值观的事:他们想知道自家的AI助手Claude在和我们聊天时,脑子里到底遵循着什么「价值观」? 结果嘛……有点出乎意料! 《终结者2》中T800,与主角人类「对齐」的未来机器人:你瞅啥? Claude中(诞生)包含的价值观超过3000种! 自力更生、战略思维,甚至还有孝顺…… Anthropic,正是因为「价值观和OpenAI不符」,几个OpenAI前员工创建的公司,检查了Claude中70万条匿名对话,并发表了一篇论文来研究Claude不为人知的另一面。 论文地址:https://assets.anthropic.com/m/18d20cca3cde3503/original/Values-in-the-Wild-Paper.pdf 研究表明,Claude大体上遵循公司预先设置的「乐于助人、诚实、无害」,同时其价值观颇有点「见人说人话,见鬼说鬼话」的能力,会根据上下文不同提供不同的建议,不论是主观的关系建议,还是客观的历史分析。…
新智元报道 编辑:编辑部 HNYZ 【新智元导读】国产大模型Vidu Q1横空出世,荣登全球视频生成榜首!支持1080p高清画质,好莱坞级首尾帧运镜,细节逼真到爆。更惊艳的是,性价比仅是同行1/10,每秒低至0.3元。 就在刚刚,全球效果最强视频生成模型诞生! 没错,它就是生数科技旗下的国产视频大模型Vidu Q1。 在权威评测基准VBench-1.0和VBench-2.0中,Q1一举超越Sora、Runway等国内外顶尖模型,勇夺文生视频赛道双榜第一。 VBench-1.0榜单 VBench-2.0榜单 Vidu Q1在视频生成逼真度遥遥领先,无论是细腻的美学质量,还是精准的对象/场景生成、视频语义一致性等,都展现了令人惊叹的效果。 而且,在内容真实性上,Vidu Q1同样取得了第一的亮眼成绩。 此外,Vidu Q1在国内权威大模型测评机构SuperCLUE的图生视频榜中表现不俗,在动漫风格、写实风格均斩获第一,力压对手。…
新智元报道 编辑:定慧 英智 【新智元导读】想象一个世界,你的亲人从未真正离去。DeepMind与科罗拉多大学提出「生成幽灵」——基于逝者数据打造自主的数字智能体。它不仅承载记忆和声音,还能以「逝者视角」回复当下事件,带来情感慰藉与想象。这不是科幻小说,AI正在创造逝者的数字回声,分享新见解并回应当下世界。 想象一下,在亲人离世后,你仍能与他们的「数字幽灵」互动、交流。 甚至获得他们「生前」从未表达过的想法或对当下事件的「看法」。 这听起来像是科幻小说的情节,但随着人工智能的飞速发展,正在迅速成为可能。 《超人:钢铁之躯》中超人父亲的「数字生命」 DeepMind研究院和科罗拉多大学博尔德分校最近的一篇论文提出一个观点,在我们的有生之年,很有可能会看到一种新的智能体,一种全新的数字生命。 在人们去世后,仍然可以做到与亲人或更广泛的世界互动。 DeepMind将这种形态称为生成幽灵(generative ghosts),因为这些智能体将能够生成「新的内容」,而不仅仅是重复其创造者生前产生的内容。 论文地址:https://arxiv.org/pdf/2402.01662 这并不是幻想,随着AI系统在广度和深度的迅速提升,生成式AI能够创建越来越强大和逼真的智能体,甚至可以基于具体的一个人完成建模。 但这种区别碳基人类的全新生命,是否会带来未知的风险、伦理挑战和人机交互(HCI,Human computer interaction)议题,还未为可知。…
新智元报道 编辑:Aeneas 【新智元导读】刚刚,马普所、加州理工的研究者发现,AI设计出了人类尚未理解的引力波探测工具,直接将物理学推动到了全新的领域!从此,人类可直接观测的宇宙体积,又扩大了50倍。更令人兴奋的是,这个AI甚至直接创造了全新的物理学。 就在刚刚,AI又将物理学,推动到了全新的领域。 来自马克斯·普朗克光科学研究所(MPL)、加州理工等机构的科学家发现,AI已经设计出了人类尚未理解的引力波探测工具。 这一发现,直接将可观测的宇宙体积扩大了50倍! 此外,这次人类研究者,还发现了全新的物理思想的核心。这种方法很容易扩展到AI驱动的实验设计,跨越基础物理的广泛领域,为宇宙打开新窗口。 这项研究,已经发表于「Physical Review X」上。 论文地址:https://journals.aps.org/prx/pdf/10.1103/PhysRevX.15.021012 一百多年前,爱因斯坦就设想出了引力波这个概念,但直到2016年,这项技术才终于赶上。 十一年后,人类科学家再次突破引力波的界限,这次,是在一个名为Urania的人工智能的帮助下。 最令人着迷的就是,在这个过程中,AI不仅复制了已知策略,还发明了一些全新的策略,完全超出了现有概念,让目前的人类远远无法理解。 现在,这些设计已经在「Detector Zoo」公开,供全球研究使用。 领导这项研究的Mario…
日本电影年度十佳作品《黎明的一切》,新近在国内院线上映。 电影讲述了两个患有身心障碍类疾病的年轻人,在失序的日常中重拾自身的故事。导演三宅唱极力避免观众产生“希望发生什么”的欲望:没有戏剧性的情节,没有浪漫化的关系,只有一点点生发于日常经验的微小溢出。 在前作《你的鸟儿会唱歌》的结尾,主人公说“感觉能够成为像空气一样的男人”。某种程度上,这句台词可以作为三宅唱影像风格的一个注解。 以下是我们与三宅唱的对话。 01. “听”见沉默的声音 看理想:《黎明的一切》的两位主人公都患有身心障碍类疾病,电影更聚焦于疾病“如何治愈”而不是“为何发作”。对你来说,为什么呈现前者更重要? 三宅唱:抛开疾病不谈,如果我们遇到了一件不愉快的事情,太过追究它为什么会发生,反而会产生逆向的效果。所以这部电影的主题不是追究黑暗,而是走向黎明。 看理想:这部电影改编自日本作家濑尾麻衣子的小说,主人公们的许多心理描写在电影中被留白,会担心观众无法“听”到他们心里的声音吗? 三宅唱:我没有担心过,电影和小说的表现手法不一样,但依然可以让观众产生共鸣。 比如男主角山添骑车的桥段,小说可能会用好几页的文字,来描述他当时的内心状况。但是电影可以利用他周围的一些内容元素,暖色调、柔光、背景音,还有他在城市中穿梭的感觉,只需要一点点的时间就能呈现他的内心。 看理想:与此同时,住宅区周围交通工具的声音被强化,目的是什么? 三宅唱:电影刚开始的时候,女主角藤泽犯病,倒在了巴士站。男主角山添也是不能坐电车的状况。表面上来说,他们两个人被交通工具抛弃,实际是被社会抛弃。交通工具的声音作为背景音融入他们的居住场景,会有一种虽然身在其中、却被抛弃的感觉。 看理想:与前两部作品《你的鸟儿会唱歌》和《惠子,凝视》不同,《黎明的一切》的主人公们从一开始就是利落的行动派,你对角色的性格偏好是怎么来的? 三宅唱:在《黎明的一切》的原作中,主人公就非常有行动力。他们也一直在思考,特别是遇到新问题,会转变思考方式。这种思考的力量,让我觉得很有魅力。 其实这三部作品的主人公,都是“如果这件事情我不想做,就不会去做”的性格,很直白,很有主动性。我自己不是这样的,平时生活中我有很多不想做的事情,但是周围环境会逼得我不得不做。有时候做了以后回来反思,又觉得有点后悔。 看理想:你的电影有很多沉默的人,他们可以占据视野的中心,也可以推进故事的发展。为什么对沉默的人感兴趣? 三宅唱:在现实生活中,说话比较大声或者说话比较多的人,更容易被注意到。沉默的人是类似于小透明的存在,往往会被忽视,但是不等于他们的内心没有任何变化,不等于他们是没有感情、不去想问题的人。…
《留校联盟》历史内容,是看理想App的压舱石。在300多档节目中,历史节目数量最多,粗略统计就有四十多档,也是最受欢迎的类别之一。 如果要问历史的用处,大概是能看到人的复杂性。搁置如火如荼的价值纷争、二极管的思维框架,去看看人类如何从过去一路走来,并相信未来不会只有一种方向。 然而,这些只是历史的副产品,去触摸历史本身就乐趣十足,能让我们沉浸其中。 本周三(4月23日)我们挑选出其中最具标志的几档节目,与大家讲解分享;在423读书日当天,同步专享仅限直播间的多重福利🎁 🎈一个惊喜:“看理想第一声优”、《从中国出发的全球史》主播、《白银时代旅行史》主讲人段志强将空降直播间,与你分享为什么“全球史”会入选高考试题,并给出他的“标准答案”。 在本场直播中,针对每档不同的历史节目,我们特别设计了与之相呼应的现实议题,并用“长期主义”的视角,再次审视这些难解之谜。 欢迎你在直播间中与我们讨论。我们会重点讲到—— 问:脱钩,有可能吗? ——《从中国出发的全球史》 问:巴以冲突,谁对谁错? ——《中东往事》 问:大环境不好,小日子怎么过? ——《白银时代旅行史》《回忆录里的20世纪中国》 问:从边疆看中心,中国有什么不一样? ——《讲谈社:中国的历史》 问:特朗普2.0,是保守主义回潮吗? ——《冷战的故事》 以长期主义的视角来看周遭,虽然仍会关心世事,但不会被一时一地的得失扰乱内心,而坚定地去做自己认同的事。…
新智元报道 编辑:编辑部 HNYZ 【新智元导读】全球首个行动浏览器Fellou重磅发布,不仅能自动填表单、管理标签页,还能跨网站执行繁琐任务。只需一句话,Fellou帮你全搞定。 得益于自由开放的Web,浏览器成为我们探索数字世界的核心入口,社交、娱乐、信息获取、生产力,它几乎可以承载我们全部的数字生活。 然而,在办公室中,键盘的敲击声此起彼伏,鼠标的点击声不绝于耳。 每天,我们平均要打开40个网站、切换26个标签页、填写20张表单。本该是助手的浏览器,却让我们成了数字世界的劳工。那些本该探索世界的指尖,被困在重复操作的循环中;那些本该用于创造的时间,被浏览器分割成信息碎片。 当AI已经开始深刻改变我们的工作与思考方式,浏览器这个「入口」本身,似乎还停留在上个时代。 时代需要一个既能提升传统浏览效率与体验,又能智能执行复杂任务的新浏览器。 它理解你的意图,将繁琐的点击化为一句简单的指令,将多个网站整合成智能工作流,在你需要时提供恰到好处的帮助,比如表单自动填充、标签页自动管理;同时,它也拥有强大的「自主行动力」,在你授权下,作为一个可靠的助理,为你处理那些跨越多个网站的繁琐事务。 这不仅是浏览器的升级,更是一场让工具更好服务于人的变革:使人类挣脱「工具的工具」的枷锁,让产品回归生产力服务本质,让每个人重获时间的主权。 Agentic Browser行动浏览器代替你的双手工作 浏览器在全球有30亿用户,几乎是所有用户最常用、最熟悉的应用。无论是查看信息、观看流媒体,还是使用SaaS应用,浏览器都承担了「总入口」的角色。 在全球SaaS生态下,浏览器已发展为类似操作系统的地位。例如,Chromebook的ChromeOS直接将浏览器作为主要用户界面,强调云端存储和多重安全防护,体现了浏览器在操作系统层面的重要性。 浏览器的形态已经多年未变,但在大模型和Agentic AI的推动下,浏览器正从「信息浏览工具」升级为「行动与工作流聚合智能体」。…