上周,中国公司 DeepSeek 发布了一款名为 R1 的大型语言模型,震惊了美国科技行业。R1 不仅能与本土竞争对手相媲美,而且成本仅为其一小部分,而且免费提供。美国股市因此损失了 1 ...
DeepSeek-R1以始料未及的速度引发了全球AI社区的狂热,但有关DeepSeek的高质量信息相对匮乏。 2025年1月26日,拾象创始人兼CEO李广密,组织了一场关于 DeepSeek的闭门讨论会, 嘉宾包括数十位顶尖AI研究员、投资人与一线 ...
Scientists researching Alpine glaciers store ice in Antarctica. By analysing air bubbles in the ice they may be able to predict the future ...
2 天前,拾象组织了一场聚焦于 DeepSeek的‘Best Ideas 闭门讨论会’,在长达 3 个小时的讨论中,我们和顶尖AI 研究员、AI 开发者和投资人一起围绕 DeepSeek的技术细节、组织以及其出圈后对 AI ...
71. DeepSeek 更多是 FP8,美国是 FP16,DeepSeek 所有都是基于有限算力工程能力的提升,对于算力高效的使用是最大亮点。上周五 DeepSeek 在北美有巨大的发酵,扎克伯格对 Meta ...
中国需要有几个领先的 AI labs 来探索能 beat OpenAI 的东西,智能要走的时间很长 ... 21. GRPO 的本质在于 base model(基础模型)得足够聪明,一个 prompt 生成用了 16 个 generation,得尝试几次才能大概率有正确的答案。不错的 base model 加上可以 verify,是 R1 提供的思路 ...