搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
腾讯网
7 小时
小模型的数学能力更强?微软亚研团队新方法挑战“参数越大模型越 ...
小语言模型,是《麻省理工科技评论》评选出的 2025 年“十大突破性技术”之一。人们往往认为大语言模型更擅长做数学题,事实上小语言模型也能做数学题甚至做得更好。(来源:《麻省理工科技评论》)1 月 8 日,由微软亚洲研究院团队领衔的一篇论文在 ...
来自MSN
13 天
DeepSeek甩出了一张“王炸”
出品|虎嗅科技组 作者|余杨 编辑|苗正卿 头图|《赌神》剧照 12月26日消息,国产大模型DeepSeek推出DeepSeek-V3,一个强大的混合专家(Mixture-of-Experts, ...
来自MSN
8 天
不少数学博士都在做人工智能,但人工智能主流方向真的需要大量 ...
我一般称人工智能为 pseudo-science 伪科学(中医式经验科学)+pseudo-math 伪数学(最多不超过SDE的数学难度)+pseudo-engineering 伪工程(我们写代码都不写unit test) 三位一体。 这里提AI里几个(我听说过的)数学最难的方向,其实都很简单。
5 天
OpenAI最大秘密,竟被中国研究者破解?复旦等惊人揭秘o1路线图
据《TheInformation》获得的泄露文件显示,OpenAI和微软对「AGI」有一个秘密定义,即任何能够在大多数任务上超越人类的系统。这两家公司在2023年达成一致,认为AGI的实现标志是OpenAI开发出一个能够创造至少1000亿美元利润的人 ...
腾讯网
11 天
斯坦福、Deepmind、剑桥联合发文:推理 Scaling Up 的简单技巧
对于提升模型性能,大多数的选择是调整模型,包括预训练、微调和强化学习等,在训练阶段增加成本。重复采样给了我们一种新的思路,不改变模型的情况下,通过增加推理耗时,也能得到很好的结果,但效果的提升强依赖于验证器的性能。
11 天
国产之光,杭州大模型公司震惊美国AI圈
2019年,幻方量化自研的深度学习训练平台「萤火一号」总投资近2亿元,搭载了1100块GPU;两年后,「萤火二号」的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
19 天
o3 没有“刷榜”
OpenAI研究科学家Nat强调,为了排除训练数据泄露的可能性,OpenAI非常重视数据污染问题,并且在ARC和FrontierMath等没见过的数据集上验证了o3的性能,确保了结果的可靠性,o3没有刷榜。 两位研究员 ,英伟达Jim Fan 和 OpenAI 研究科学家Nat McAleese 在社交媒体上分享了他们对 o3 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈