小语言模型,是《麻省理工科技评论》评选出的 2025 年“十大突破性技术”之一。人们往往认为大语言模型更擅长做数学题,事实上小语言模型也能做数学题甚至做得更好。(来源:《麻省理工科技评论》)1 月 8 日,由微软亚洲研究院团队领衔的一篇论文在 ...
出品|虎嗅科技组 作者|余杨 编辑|苗正卿 头图|《赌神》剧照 12月26日消息,国产大模型DeepSeek推出DeepSeek-V3,一个强大的混合专家(Mixture-of-Experts, ...
我一般称人工智能为 pseudo-science 伪科学(中医式经验科学)+pseudo-math 伪数学(最多不超过SDE的数学难度)+pseudo-engineering 伪工程(我们写代码都不写unit test) 三位一体。 这里提AI里几个(我听说过的)数学最难的方向,其实都很简单。
据《TheInformation》获得的泄露文件显示,OpenAI和微软对「AGI」有一个秘密定义,即任何能够在大多数任务上超越人类的系统。这两家公司在2023年达成一致,认为AGI的实现标志是OpenAI开发出一个能够创造至少1000亿美元利润的人 ...
对于提升模型性能,大多数的选择是调整模型,包括预训练、微调和强化学习等,在训练阶段增加成本。重复采样给了我们一种新的思路,不改变模型的情况下,通过增加推理耗时,也能得到很好的结果,但效果的提升强依赖于验证器的性能。
2019年,幻方量化自研的深度学习训练平台「萤火一号」总投资近2亿元,搭载了1100块GPU;两年后,「萤火二号」的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
OpenAI研究科学家Nat强调,为了排除训练数据泄露的可能性,OpenAI非常重视数据污染问题,并且在ARC和FrontierMath等没见过的数据集上验证了o3的性能,确保了结果的可靠性,o3没有刷榜。 两位研究员 ,英伟达Jim Fan 和 OpenAI 研究科学家Nat McAleese 在社交媒体上分享了他们对 o3 ...