就说这个本周刚发布的 DeepSeek R1,它没有任何监督训练的纯强化学习路线令人震撼,从去年 12 月 Deepseek-v3 基座发展到如今堪比 OpenAI o1 的思维链能力,似乎是很快达成的事。
机器之心报道编辑:泽南、杨文我们都没预料到,AI 领域的 2025 年是这样开始的。DeepSeek R1 真是太厉害了!最近,「神秘的东方力量」DeepSeek 正在「硬控」硅谷。我让 R1 详细解释勾股定理。这一切都是 AI 在不到 30 ...