首页 > 实用技巧 > 干货教程 > 人工智能新模型可解码DNA隐藏“语言”

人工智能新模型可解码DNA隐藏“语言”

发布时间:2024-08-08 16:49:17来源: 15210273549

基于DNA序列训练的大型语言模型(艺术图)。

图片来源:物理学家组织网

科技日报北京8月6日电 (记者张佳欣)DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。

大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。

在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。

研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。

GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。

干货教程更多>>

细节狂魔起亚,刹车踏板研发了3代! 美国:二手电车贬值速度是油车的6倍,用户还是喜欢特斯拉! Honda 2024中国摩博会发布新战略、新车型价格,畅享逛展新体验 阿维塔昆仑增程打破“增程落后论”认知偏差,获得广泛认可 全新瑞虎7申报图,还有混动版,果然是“虎子一家亲” 可玩性很高,最快零百加速6.9s,2024款名爵MG5售价6.59万元起 选它还是选比亚迪海豚?吉利星愿预售价7.88万元起 B级车王牌再升级!仅15.99万元起售,新一代帕萨特销量稳了? 上市才5个月,比亚迪元UP单月销量就已近2万台,都是什么人在买? 6款全新车型申报图曝光!想买车的这回真可以再等等 9月快结束了?别急,还有这8款新车将上市,总有一款能适合你 高颜值,好听,舒适不入耳!南卡OECC2开放式蓝牙耳机体验 白先勇《牡丹花开二十年》:回顾二十年的昆曲复兴路 低价实用的开放式、半入耳、入耳式蓝牙耳机合集,开学季推荐。 音质逼真而层次分明的蓝牙耳机3款 每周质量报告丨长时间戴耳机的后果有多严重?专家提示 蓝牙6.0来了,定位精到厘米级,你准备好了吗? Keychron K2 MAX三模机械键盘开售:75% 布局,499元起 从贵州大山走上世界舞台,22岁小伙与全球车身修理能手同台竞技 《利玛窦的记忆宫殿》:在多元的世界,如何抵达理解的彼岸 推荐一些适合英特尔酷睿 Ultra 5 245K 处理器的电脑配置 英特尔酷睿 Ultra 5 245K 处理器适合做图吗? CUDIMM内存即将成为主流,阿斯加特正式发布CUDIMM DDR5 9600MHz AMD Ryzen AI 7 PRO 360 是首款配备 Radeon 880M 集成显卡的 8 核心 Strix APU 英特尔酷睿 Ultra 5 245K 处理器与哪些型号的显卡搭配比较好? 雷克沙Professional Go手机固态硬盘发售,1199元起 华硕技嘉已注册大量Z890主板 分别有29款和18款 为啥电视再便宜也成不了你的专业显示器? 泰坦军团推出“P2710H”27英寸显示器:1080P 240Hz,999元 终于能替代台式电脑了,零损耗外接显卡的迷你主机,还有缺点吗?