Math Test 1 - 搜索 News

小语言模型，是《麻省理工科技评论》评选出的 2025 年“十大突破性技术”之一。人们往往认为大语言模型更擅长做数学题，事实上小语言模型也能做数学题甚至做得更好。（来源：《麻省理工科技评论》）1 月 8 日，由微软亚洲研究院团队领衔的一篇论文在 ...

来自MSN13 天

DeepSeek甩出了一张“王炸”

出品｜虎嗅科技组作者｜余杨编辑｜苗正卿头图｜《赌神》剧照 12月26日消息，国产大模型DeepSeek推出DeepSeek-V3，一个强大的混合专家（Mixture-of-Experts, ...

来自MSN8 天

不少数学博士都在做人工智能，但人工智能主流方向真的需要大量 ...

我一般称人工智能为 pseudo-science 伪科学（中医式经验科学）+pseudo-math 伪数学（最多不超过SDE的数学难度）+pseudo-engineering 伪工程（我们写代码都不写unit test）三位一体。这里提AI里几个（我听说过的）数学最难的方向，其实都很简单。

5 天

OpenAI最大秘密，竟被中国研究者破解？复旦等惊人揭秘o1路线图

据《TheInformation》获得的泄露文件显示，OpenAI和微软对「AGI」有一个秘密定义，即任何能够在大多数任务上超越人类的系统。这两家公司在2023年达成一致，认为AGI的实现标志是OpenAI开发出一个能够创造至少1000亿美元利润的人 ...

腾讯网11 天

斯坦福、Deepmind、剑桥联合发文：推理 Scaling Up 的简单技巧

对于提升模型性能，大多数的选择是调整模型，包括预训练、微调和强化学习等，在训练阶段增加成本。重复采样给了我们一种新的思路，不改变模型的情况下，通过增加推理耗时，也能得到很好的结果，但效果的提升强依赖于验证器的性能。

11 天

国产之光，杭州大模型公司震惊美国AI圈

2019年，幻方量化自研的深度学习训练平台「萤火一号」总投资近2亿元，搭载了1100块GPU；两年后，「萤火二号」的投入增加到10亿元，搭载了约1万张英伟达A100显卡。

19 天

o3 没有“刷榜”

OpenAI研究科学家Nat强调，为了排除训练数据泄露的可能性，OpenAI非常重视数据污染问题，并且在ARC和FrontierMath等没见过的数据集上验证了o3的性能，确保了结果的可靠性，o3没有刷榜。两位研究员，英伟达Jim Fan 和 OpenAI 研究科学家Nat McAleese 在社交媒体上分享了他们对 o3 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果