> 自媒体 > (AI)人工智能 > 科学家们使用DeepSeek
科学家们使用DeepSeek
来源:NASA爱好者
2025-02-07 10:28:58
214
管理

DeepSeek-R1自1月20日发布以来,因其高效且低成本的特性,迅速引起全球科学界的关注。研究人员发现,DeepSeek-R1在解决数学和科学问题方面的能力与OpenAI 的o1模型相当。此外,DeepSeek-R1的开源性质使科学家能够根据自身需求进行定制和优化。

DeepSeek-R1 的低成本和开放性为研究人员提供了前所未有的便利。他们可以通过DeepSeek提供的应用程序接口(API)以极低的成本访问该模型。此外,研究人员还可以将模型下载到自己的服务器上进行本地运行和进一步开发,这在许多封闭源模型中是无法实现的。

自发布以来,DeepSeek-R1已被大量研究人员用于训练自定义推理模型。根据Hugging Face的数据,自发布以来,该网站已记录了超过 300 万次 DeepSeek-R1 不同版本的下载量,包括独立用户已构建的版本。

在对DeepSeek-R1在数据驱动的科学任务上的初步测试中,研究人员发现该模型在数学和编程任务上表现出色。例如,在加州大学伯克利分校编写的数学问题集MATH-500中,DeepSeek-R1 达到了97.3%的准确率,超越了 96.3% 的人类参与者。然而,DeepSeek-R1 在某些任务上仍存在挑战,研究人员需要具备相关领域的专业知识,以有效利用该模型。

(提示:MATH-500:包含500个测试样本的MATH评测集,全面考察数学解题能力。LiveCodeBench:评估真实编程场景中代码生成和问题解决能力的高难度评测集。)

DeepSeek-R1 的发布引发了全球科技界的广泛关注。美国科技公司对其低成本和高效性能表示担忧,认为这可能对现有商业 AI 模型构成挑战。然而,DeepSeek-R1 的开源和低成本特性也被视为推动 AI 技术民主化的重要一步,使更多研究人员能够参与到 AI 的研究和应用中来。

科学任务

在对R1在数据驱动科学任务上的能力进行初步测试时(这些任务选自涉及生物信息学、计算化学和认知神经科学等主题的真实论文),Sun 表示该模型的表现与o1不相上下。她的团队要求这两个AI模型完成他们设计的一套名为ScienceAgentBench的题组中的20个任务,其中包括数据分析和数据可视化等任务。两种模型正确解决的挑战大约只有三分之一。Sun 还指出,通过 API 运行 R1 的费用比 o1 低 13 倍,但 R1 的“思考”时间比 o1 慢。

在数学领域,R1也展现出潜力。英国牛津大学的数学家和计算机科学家 Frieder Simon要求这两个模型在抽象的泛函分析领域构造一个证明,并发现R1的论证比 o1更有希望。不过,他表示,鉴于此类模型也会犯错,研究人员要想从中获益,必须具备辨别优劣证明的能力。

对R1充满热情的很大原因在于它以“开放权重”方式发布,这意味着其算法中各部分之间学到的连接可以供后续构建利用。下载 R1 或者 DeepSeek 发布的体积更小的“蒸馏”版本的科学家们,可以通过额外训练(即微调)来提升模型在各自领域的性能。Sun 说,给定合适的数据集,研究人员甚至可以训练该模型以改善其在科学过程中特定编码任务上的表现。

参考

[1]https://www.nature.com/articles/d41586-025-00275-0?linkId=12723713

[2]https://huggingface.co/datasets/HuggingFaceH4/MATH-500

[3]https://github.com/openai/prm800k/tree/main?tab=readme-ov-file#math-splits

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
降至10.5万起,五款豪华SUV降幅大增!奥迪都跌破14万很划算..
预算不多又想买豪车的同学,可以参考以下这5款,降幅力度翻倍增长;最低..
10万预算买纯电SUV,埃安Y领衔,4款纯电SUV车型盘点
8月油价在进行短暂下调后又进行了一轮涨价,而消费降级也让许多消费者在..
官降2.8万!新款丰田凌放上市,增配还降价,“丰田最美SUV”更香了?..
在设计方面,凌放延续着现款车型设计,车身上的混动标识统一变换为“HEV..
这6款SUV新款将上市,要买车的可以再等等
马上快到年底了,很多人想买车的心再次躁动起来,市面上可选的热门车型已..
家用SUV谁才是最优选?北京现代胜达与丰田汉兰达全面解析..
如果您是一位奶爸或者宝妈,或刚刚成立的新家庭,想购入一台SUV,平日能..
试驾上汽大众途岳新锐,City属性的平价SUV
今天我们的主角是来自上汽大众途岳新锐,在聊它之前,我们一定要记住一个..
轿跑SUV颠覆者!华为正式发布智界R7,售价25.98万元起
9月24日,鸿蒙智行首款轿跑SUV智界R7正式上市,售价25.98-33.98万元。新..
10万级方盒子SUV,搭载混动四驱,新款的BJ30来了
一提到方盒子SUV,我们的第一印象肯定是一副征服野外的硬派形象,能耗通..
新车 | 售16.99万元 奇瑞探索06悦野版四驱领潮型上市 1.6T紧凑型SUV..
文:懂车帝原创 史景旭[懂车帝原创 产品] 日前,我们从官方获悉,奇瑞探..
关于作者
泡沫人生(普通会员)
文章
844
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40399 企业收录2981 印章生成237284 电子证书1051 电子名片60 自媒体49544

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索