reasoning model - 搜索 News

受美国 AI 芯片禁令影响，DeepSeek 团队不得不在性能较低的 H800 GPU（而非 H100）上进行多项优化创新，最终以低于 600 万美元的计算成本完成了模型训练（研发成本不计）。

20 小时

如今的观点认为，DeepSeek的模型如此高效，以至于算力不再是瓶颈，整个市场因此出现了严重的算力过剩。然而，这种说法过于夸大。“杰文斯悖论” ...

一些您可能无法访问的结果已被隐去。

今日热点