OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念
作者:啊哈哈哈 来源:08论坛 时间:2025-03-20 12:06:27
Mark Chen (@markchen90)1月28 日
祝贺 DeepSeek 成功开发出 o1级推理模型!他们的研究论文表明,他们发现了我们在实现o1的过程中的一些核心理念。
然而,我认为外界对这项成果的反应有些过度,尤其是在关于成本的叙述上。有两个范式(预训练和推理)意味着我们可以在两个轴线上优化能力,而不仅仅是一个,这降低了整体成本。
但这也表明我们可以沿两个方向扩展能力,而我们计划在这两个方向上积极投入计算资源!
随着蒸馏研究的进步,我们也发现降低成本和提升能力这两者之间的关系越来越独立。以更低成本提供服务(尤其是在较高延迟的情况下)并不代表能够实现更高的能力。
我们将继续优化模型以更低的成本提供服务同时对我们的研究计划保持乐观并专注于实施。今年第一季度以及全年,我们期待为大家带来更强大的模型!
更多资讯
热门文章
推荐对话
换一换- 人气排行
- 1 OpenAI研究员称:Deepseek发现了他们在实现o1的过程中的一些核心理念
- 2 OpenAI奥特曼对Deepseek R1的回应
- 3 如何评价2025蛇年春晚宇树科技H1机器人舞蹈《秧BOT》?
- 4 如何在本地部署DeepSeek Janus Pro?
- 5 如何用Ollama安装DeepSeek?
- 6 字节Trae教程:IDE设置方法
- 7 什么是大模型的蒸馏(distillation),DeepSeek遭遇的“模型蒸馏”指控是怎么回事?
- 8 DeepSeek数据库泄露:包含聊天记录、密钥、后端等敏感的信息被泄露
- 9 Missionl AI发布Mistral Small 3,仅 24B 参数,但性能可匹敌 70B 级别模型
- 10 2025蛇年春节期间最新AI新闻