Navigation menu

新闻中心

DeepSeek

北京新闻Beike Finance（记者LuO Yidan）在5月29日晚上，DeepSeek的微信官员表示，DeepSeek-R1模型完成了小型版本的升级，当前版本是DeepSeek-R1-0528。用户通过官方网站，应用程序或迷你程序输入对话接口后，他们可以启用“深思熟虑”功能来体验最新版本。 API也会同时更新，并且呼叫方法保持不变。具体而言，DeepSeek-R1-0528仍然使用DeepSeek V3基本模型作为2024年发布的基础模型，但它在随后的培训过程中投入了更大的计算能力，这大大改善了思维和推理能力的深度。更新的R1模型在许多基准评估（例如数学，编程和一般逻辑）中取得了最高级别的成果。O3和Gemini-2.5-Pro。与R1的旧版本相比，复杂识别任务中新版本的新版本的性能已大大改善。例如，在AIME 2025测试中，新模型的准确性从旧版本的70％增加到87.5％。这种发展是由于模型在推理过程中的思维深度的改善所致：在AIME 2025测试集中，旧模型每个问题平均使用12K代币，而新模型平均每个问题使用23k代币，表明它在解决问题过程中对该问题进行了更详细和深入的思考。同时，在删除了Mind Chain Ng DeepSeek-R1-0528之后，训练了Qwen3-8b基础，并训练Depts-R1-0528-QWEN3-8B。 8B模型仅次于DeepSeek-R1-0528在数学测试AIME 2024中，该模型超过QWEN3-8B（+10.0％），并与QWEN3-235B相比。 “我们认为，DeepSeek-R1-0528思想链将是学术推理模型研究的重要意义DeepSeek说。此外，DeepSeek R1的新版本将在“幻觉”问题上进行优化。与旧版本相比，更新的模型将兔子引用至约45％至50％，在场景中，例如重写和抛光，可以在诸如pristish和pristishers的读写中，并有效地读取，并确定有效的效果，并确定，并确定不可行的效果。 R1的更新模型是MGA论文，小说，散文和其他流派的优化，可以拿出长度和更完整的结构和更完整的结构和内容，并显示出更接近人类的偏好的写作风格。

上一篇：卫生工人将“扔掉自己并捡起自己”，因此无需下一篇：美联储主席鲍威尔会见美国总统，没有讨论财务

新闻中心

DeepSeek

相关新闻