新智元报道 编辑:LRS 【新智元导读】史上最大的基因组AI模型Evo 2使用超过12.8万个基因组数据训练,包含9.3万亿个核苷酸,能预测突变效应、设计 DNA 序列,并通过可视化工具展示学习到的生物特征,为生成生物学和疾病研究提供新思路。 生命的一切表现,基本都可以从DNA编码中找到答案。 基因组(Genome)包含了生物体所有基因以及非编码的DNA序列,承载了生物体发育、生长、繁殖和适应环境所需的全部遗传信息,近年来基因组相关的测序、合成和编辑工具已经彻底改变了生物学研究。 然而,基因组的复杂性是巨大的,即使是最简单的微生物,也包含数百万个DNA碱基对,要智能地构建新的生物系统,研究人员还需要深入理解基因组编码的复杂信息。 2024年11月,研究人员在Science上发表了一项研究Evo 1,基于单细胞(270万个原核生物和噬菌体)基因组进行训练,具有70亿个参数,在单核苷酸(构成DNA或RNA的基本单元)设置下实现了13万碱基的上下文长度。 Evo 1论文链接:https://www.science.org/doi/10.1126/science.ado9336 Evo 1在DNA、RNA 和蛋白质模式上展示了更好的零样本功能预测能力,并通过实验验证了Evo 1生成的CRISPR-Cas分子复合物以及IS200和IS605转座系统的功能活性,证明了使用语言模型进行蛋白质-RNA和蛋白质-DNA代码设计的前景。…
新智元报道 编辑:编辑部 HXZ 【新智元导读】就在刚刚,港中文博士Jie Liu刚刚破解了GPT-4o的前端生图秘密:逐行生成的效果,其实只是浏览器上的前端动画效果,并不准确。它很大可能是原生自回归生成的,甚至我们还可以手动改图。谷歌DeepMind大佬则猜测,GPT-4o图像生成应该是一种多尺度和自回归的组合。 GPT-4o,如今已经引发了全网的「吉卜力」狂潮。 从全网的模因狂热到备受质疑的版权问题,OpenAI本周的这项全新发布,引发的戏剧性事件如雨后春笋般层出不穷。 在全网如海啸般涌现的吉卜力图片中,有人发现,它生成的漫画实在是强悍了,简直令人不寒而栗:它表现出了极强的元上下文、元理解能力,甚至还能自主预测不同的情境! 遗憾的是,目前OpenAI并未公布GPT-4o的生图技术细节,只提到采用的是自回归方法,类似语言模型。 也就是说,4o与DALL-E的扩散模型不同,它使用自回归模型逐步生成图像,根据先前的像素或补丁预测下一个像素或补丁。这就能让它更好地遵循指令,甚至进行逼真的照片编辑。 虽然没有更多的细节,但这丝毫抵挡不住AI社区技术大神们的火眼金睛。 就在刚刚,港中文的一位博士生Jie Liu破解了GPT-4o不一般的前端生图秘密:实际上,它很大可能是原生自回归(AR)生成的,甚至我们可以手动改图。 无独有偶,CMU博士Sangyun Lee也推测出,GPT-4o的图像生成原理,应该大致如下: GPT-4o生成视觉token,然后由扩散解码器将这些token解码为像素空间中的图像 不只是普通的扩散模型,而是类似于Rolling…
新智元报道 编辑:定慧 【新智元导读】马斯克又一次展现了对「X」和AI的狂热,决定将旗下社交平台X以全股票交易方式出售给自己的AI公司xAI,合并后xAI估值1130亿美元,超过了2月份对OpenAI要约价974亿美元。这次收购彰显了马斯克「All in AI」战略决心。 马斯克依然还是那么喜欢「X」,并且决定「All in AI」! 马斯克在自己的社交网站X上宣布,xAI将要和X合并! 合并后xAI的估值为800亿美元,X的估值为330亿美元(450亿美元减去120亿美元的债务),新的xAI估值将来到1130亿美元。 据纽约时报报道,马斯克是将X「出售」给他的AI初创公司xAI。 也就是以AI为主导,以「理解宇宙」为使命的xAI公司将要「全股票交易的方式收购」社交媒体X。 这波操作,着实有点「AI吞噬一切」的味道! xAI和X两家公司发展轨迹 这两家公司之前的发展轨迹完全不同。 xAI自两年前成立以来,迅速成为全球领先的人工智能实验室之一,以前所未有的速度和规模构建模型和数据中心。 xAI旗下的Colossus是世界上最大的AI超级计算机,目前正被用于训练xAI的Grok系列大语言模型,xAI正在将Colossus的规模进一步扩大一倍至20万颗NVIDIA…
新智元报道 编辑:编辑部 ZJs 【新智元导读】科学家正在逃离美国!欧洲、加拿大甚至墨西哥都成了美国科学家的备选地点。美国的人才吸引力断崖式下降。更令人吃惊的是,一位已经在哈佛大学找到工作的科学家,都被中途遣返出境了! 特朗普狂砍学术界经费,恶果来了! 欧洲抄底美国人才这种百年难遇的机会,如今真来了? 根据Nature的调查,约1200名美国科学家表示,他们正在考虑离开美国,首选欧洲和加拿大。 在参与调查的人群中,这一比例相当大,高达75%! 在参与调查的早期职业研究人员中,这一趋势尤为明显。 在美国顶尖大学,一位植物基因组学和农业专业的硕士研究生说:「这是我家乡——我真的热爱我的国家,但很多导师都告诉我:现在就离开美国!」 一名从事核裂变研究的科学家,原本计划前往美国,但现在他已经改变计划,正在欧洲寻找机会。 如今,美国正在以光速流失海外人才。 更令人发指的是,一名反对战争的俄罗斯科学家选择逃离祖国,并且已经在哈佛大学找到工作,却被中途遣返。 她从法国学术会议返回洛根机场时忽然被拘留,然后被送至路易斯安那州的移民拘留中心,将被驱逐回俄罗斯。 目前还未知这名科学家被驱逐的详细原因,但很多人已经联想起,在二战前逃离德国,随后为美国做出巨大贡献的科学家们。如今这一幕,仿佛历史的重演。 而且,这已经不是第一起合法公民遭驱逐事件了。前不久的德国工程师事件,就已经引起了轩然大波。 这名持有绿卡的德国工程师,在波士顿的洛根机场被拘留了数小时,受尽折磨。…
本 文 约 3700 字 阅 读 需 要 10 分 钟 想象一下自己是一名普通的秦朝“士伍”,生活在前220年左右的洞庭郡迁陵县,你会过着什么样的生活? 衣服比手足重要 《三国演义》里有一句很冒犯女性的话:“妻子如衣服,兄弟如手足。”不过在秦朝,衣服和手足的重要性也许是颠倒的:当时肉刑很普遍,《秦律》屡屡出现对犯人砍脚的规定,反倒是衣服几乎堪称与房屋、牲畜一样的不动产,《封诊式》就有衣服被盗的案例,足见失主对此有多重视。 枳枸,白雉与虎 和当时长江流域大部分地区一样,迁陵地区山林川泽密布,动植物种类丰富。里耶秦简记载了各种经济作物,以及迁陵百姓日常与之相关的种种劳作。还有一种特殊作物“枳枸”,很可能是迁陵当地的特产。这种植物现在称枳椇,据《本草纲目》:“枳椇木高三四丈,叶圆大如桑柘……(果实)如鸡爪形……嚼之味甘如蜜。”功用是主治头风、利大小便、解酒毒、辟虫毒等。“贰春乡枳枸志”记录了当地枳枸的数量、大小、位置,也记录了秦始皇三十四年,枳枸没有结果实的情况。 简牍中更出现大量野生动物的记载,大多是狩猎的对象。在当时,狩猎不仅为获得肉食,也是一项重要工作,《史记》中李斯在上蔡当小吏时,就曾驱赶黄犬去捕兔子。里耶秦简则有“捕羽”“捕猿”的记录:廿八年二月辛未朔庚寅,贰春乡守行敢言之:廿八年岁赋献黄二、白翰二、黑翰二、明渠鸟二、鷩鸟四。令令乡求捕,毋出三月。乡毋吏、徒,行独居,莫求捕。捕爰用吏、徒多。谒令官有吏、徒将求捕,如廿七年捕爰,乃可以得爰。敢言之。 白翰即白雉,里耶秦简有多枚简提到“白翰羽”,以及捕羽、买羽、求羽等行为,还有一枚简记载:“廿七年羽赋二千五(百)”,专家据此推测,迁陵当地需要每年缴纳白雉羽作为贡赋。有观点认为,这是用于制作箭羽,学者王子今则认为白雉羽主要用于装饰。 爰即猨、猿,它们居住于原始森林最上层,行动又极为敏捷,往往只闻啼声而难觅踪影,无论陷阱还是罗网都捕捉不到,只能使用弓箭。《庄子·山木》描述:“王独不见夫腾猿乎?其得柟梓豫章也,揽蔓其枝而王长其间,虽羿、逢蒙不能眄睨也。”由于难度太大,迁陵的捕猎活动需要由官府组织,且需要官吏亲自带队,因此有了“捕爰用吏、徒多。谒令官有吏、徒将求捕”的记载。…
新智元报道 编辑:定慧 犀牛 【新智元导读】AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」,甚至故意撒谎。Anthropic刚刚推出了一项突破性研究,用类似大脑扫描的技术,深入Claude 3.5 Haiku的「脑子」,揭开了它运行的一些秘密。 AI的性能愈发强大,一个新模型可能前一天还是SOTA(最佳模型),第二天就被拍了下去。 不过,这些强大的AI上空总有一团迷雾笼罩。 那就是:他们到底是怎么找到答案的? 其整个运作机理就像个「黑箱子」。 我们知道模型输入的是什么提示词,也能看到它们输出的结果,但中间的过程,就连开发这些AI的人也不知道。 简直是个谜。 这种不透明带来了各种麻烦。 比如,我们很难预测模型什么时候会「胡说八道」,也就是出现所谓的「幻觉」。 更可怕的是,有些情况下,模型会撒谎,甚至是故意骗人! 不过,就在刚刚,Anthropic提出了一条解决这些问题的新方法。 博客地址:https://www.anthropic.com/research/tracing-thoughts-language-model…