机器学习算法可以发现新事物还可以帮助我们完成文书工作
计算机是否足够聪明以进行科学发现?美国能源部劳伦斯伯克利国家实验室的研究表明答案可能是肯定的。据AnubhavJain领导的一个团队称,这表明没有材料科学培训的算法可以扫描数百万篇论文的文本并发现新的科学知识。
他们收集了330万份已发表材料的摘要,并将它们输入到一个名为Word2vec的算法中,该算法分析了单词之间的关系,然后能够提前几年预测新热电材料的发现,并建议尚未知的材料作为热电材料的候选材料。
实验包括让算法“过去”执行任务;也就是说,将摘要提供给某一年,然后评估其预测如何被淘汰出局。
“在没有告诉材料科学的任何内容的情况下,它学会了周期表和金属晶体结构等概念,”Jain说。
“这暗示了这项技术的潜力。但也许我们发现的最有趣的事情是,你可以使用这种算法来解决材料研究中的差距,这是人们应该研究但到目前为止还没有研究过的东西。“
该研究结果发表在“自然”杂志上。
该团队收集了1922年至2018年期间在1000多种期刊上发表的论文的摘要。该算法在这些摘要中采用了大约500,000个不同的单词,并将每个单词转换为200维向量,或200个数字的数组。
“重要的不是每个数字,而是用数字来看看单词是如何相互关联的,”Jain说。
在对材料科学文本进行培训时,该算法能够简单地根据摘要中单词的位置以及与其他单词的共现来学习科学术语和概念的含义,例如金属的晶体结构。
当每个化学元素的矢量投影到两个维度时,它甚至能够学习周期表上元素之间的关系。
研究人员说,该项目的动机是科学家们已经理解了大量已发表的研究。
伯克利的GerbrandCeder说:“在每个研究领域都有100年的研究文献,每周都会有更多的研究成果出来。”
“研究人员只能访问其中的一小部分。我们认为,机器学习能否以无人监督的方式利用所有这些集体知识,而不需要人类研究人员的指导?”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
最近收到一位患者的留言,说自己这几天总感觉肛门有下坠胀感,特别难受,上网一查,好多信息都指向癌症,这可...浏览全文>>
-
腹痛、腹泻总反复!可能是小肠、大肠在抗议。基于症状特征区分小肠疾病与大肠疾病的具体差异分析:一、核心症状...浏览全文>>
-
近日,中国中医药信息学会肛肠分会·肿瘤分会·治未病分会·河北名医学会肛肠分会·盆底与便秘分会·河北省中...浏览全文>>
-
安徽蚌埠的长安启源E07作为一款备受关注的新能源车型,其价格和配置一直是消费者热议的话题。如果你正考虑入手...浏览全文>>
-
近年来,随着新能源汽车市场的快速发展,插电式混合动力车型逐渐成为消费者关注的焦点。生活家PHEV作为一款备...浏览全文>>
-
在2025款生活家PHEV车型正式上市之前,提前了解相关费用明细对于购车者来说至关重要。这款插电式混合动力车型...浏览全文>>
-
大众途昂作为一款中大型SUV,凭借其宽敞的空间和强劲的动力配置,在市场上一直拥有不错的口碑。对于计划购买20...浏览全文>>
-
阜阳地区的长安启源Q05 2025款车型凭借其时尚的外观设计和丰富的配置,吸引了众多消费者的关注。这款车型作为...浏览全文>>
-
阜阳揽巡作为一款备受关注的中型SUV,凭借其豪华的配置和超值的价格吸引了众多消费者的目光。这款车不仅在外观...浏览全文>>
-
淮南长安启源A07自上市以来便凭借其卓越的性能和亲民的价格赢得了众多消费者的青睐。作为2025款的新车型,它在...浏览全文>>