搜索
热门搜索:
Chatgpt
预训练模型
多模态
智源大会
NLP
社区应用
活动
论文
社交
专栏
翻译
社群
大模型
具身智能
青源研究组
精彩活动
更多
查看详情
2024-06-14 09:00:00
北京智源大会
报名中
2025-02-19 10:30:00
s1: 一千个思考样本激发大语言模型的Test-time Scaling
观看回放
2025-01-16 14:30:00
LLM-as-a-Judge,当AI变成“判官”|AI+金融量化发展与探索
观看回放
2025-01-14 10:30:00
Thinking in Space: 多模态大语言模型如何观察、记忆和回忆空间
观看回放
2025-01-09 10:30:00
Yann LeCun谢赛宁工作组,探索大模型隐藏的视觉能力
观看回放
2025-01-08 09:30:00
线上直播丨2025 AI十大趋势发布会
热门论文
更多
1
Ultra-Sparse Memory Network
928
2
Radiant Foam: Real-Time Differentiable Ray Tracing
917
3
SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training
856
4
Evolution and The Knightian Blindspot of Machine Learning
519
5
Old Optimizer, New Norm: An Anthology
513
6
MetaUrban: A Simulation Platform for Embodied AI in Urban Spaces
460
7
Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach
425
8
Path Planning for Masked Diffusion Model Sampling
404
9
Training Software Engineering Agents and Verifiers with SWE-Gym
373
10
Memory Layers at Scale
367
专栏推荐
更多
博士论文 | Porto 2024 | 图强化学习用于改善智能电网服务 134页
清华大学|104页《DeepSeek从入门到精通》,人人必备的AI手册!
DeepSeek-R1推理本地跑,7GB GPU体验啊哈时刻?GRPO内存暴降,GitHub超2万星
Lex Fridman 五小时聊 DeepSeek:一文看懂 DeepSeek 的创新与2025 AI 趋势
DeepSeek流量超Gemini登顶全球第二!马斯克挟xAI更强模型宣战
AlphaFolding填补蛋白质动态结构预测空白!复旦大学等提出4D扩散模型,成果入选AAAI 2025
直播预告|巴黎人工智能行动峰会:中国人工智能发展与安全研究网络-边会“人工智能技术进步与应用”
大模型微调到底有没有技术含量?
清华「DeepSeek从入门到精通」正式发布!104页超全解析
免费无限次!671B满血版DeepSeek R1隐藏入口,优秀平台推荐!
凌晨5点Meta血腥裁员,近4000人将失业!转身砸重金挖顶尖AI人才