杭州深度求索在 MIT 许可证下发布了能挑战 OpenAI o1 的推理模型 DeepSeek R1。R1 系列模型包括 DeepSeek-R1-Zero 和 DeepSeek-R1,其最大版本有 6710 亿个参数,深度求索称在数学和编程测试中的表现与 OpenAI 的 o1 simulated reasoning(SR)模型相当。深度求索同时发布了六个规模较小的版本 DeepSeek-R1-Distill,参数规模从 15 亿到 700 亿,其中参数规模最小的版本能在笔记本上运行,完整版本则需要更多计算资源。深度求索称 R1 在 AIME(数学推理测试)、MATH-500(文字问题集)和 SWE-bench Verified(编程评估工具)中的表现优于 OpenAI 的 o1。
© 2025, 免責聲明:* 文章不代表本網立場,如有侵權,請盡快聯繫我們 info@uscommercenews.com * 讀者評論僅代表其個人意見,不代表本網立場。評論不可涉及非法、粗俗、猥褻、歧視,或令人反感的內容,本網有權刪除相關內容。.