DeepSeek

北京新闻Beike Finance(记者LuO Yidan)在5月29日晚上,DeepSeek的微信官员表示,DeepSeek-R1模型完成了小型版本的升级,当前版本是DeepSeek-R1-0528。用户通过官方网站,应用程序或迷你程序输入对话接口后,他们可以启用“深思熟虑”功能来体验最新版本。 API也会同时更新,并且呼叫方法保持不变。具体而言,DeepSeek-R1-0528仍然使用DeepSeek V3基本模型作为2024年发布的基础模型,但它在随后的培训过程中投入了更大的计算能力,这大大改善了思维和推理能力的深度。更新的R1模型在许多基准评估(例如数学,编程和一般逻辑)中取得了最高级别的成果。O3和Gemini-2.5-Pro。与R1的旧版本相比,复杂识别任务中新版本的新版本的性能已大大改善。例如,在AIME 2025测试中,新模型的准确性从旧版本的70%增加到87.5%。这种发展是由于模型在推理过程中的思维深度的改善所致:在AIME 2025测试集中,旧模型每个问题平均使用12K代币,而新模型平均每个问题使用23k代币,表明它在解决问题过程中对该问题进行了更详细和深入的思考。同时,在删除了Mind Chain Ng DeepSeek-R1-0528之后,训练了Qwen3-8b基础,并训练Depts-R1-0528-QWEN3-8B。 8B模型仅次于DeepSeek-R1-0528在数学测试AIME 2024中,该模型超过QWEN3-8B(+10.0%),并与QWEN3-235B相比。 “我们认为,DeepSeek-R1-0528思想链将是学术推理模型研究的重要意义DeepSeek说。此外,DeepSeek R1的新版本将在“幻觉”问题上进行优化。与旧版本相比,更新的模型将兔子引用至约45%至50%,在场景中,例如重写和抛光,可以在诸如pristish和pristishers的读写中,并有效地读取,并确定有效的效果,并确定,并确定不可行的效果。 R1的更新模型是MGA论文,小说,散文和其他流派的优化,可以拿出长度和更完整的结构和更完整的结构和内容,并显示出更接近人类的偏好的写作风格。