当前位置：首页>排行榜>六大权威榜单登顶,吞吐量提高9倍!英伟达开源全模态模型 Nemotron 3 Nano Omni

六大权威榜单登顶,吞吐量提高9倍!英伟达开源全模态模型 Nemotron 3 Nano Omni

先看看核心性能

架构：30B-A3B混合专家架构（总300亿参数量，实际激活约30亿）；
吞吐量提升：比同类开源全模态模型最高提升9.2倍；
内存效率：内存与计算效率最高提升4倍；
上下文窗口：支持高达256K；
排行榜表现：在六大权威榜单登顶。文档智能 (MMlongbench-Doc、OCRBenchV2)、WorldSense (视频理解)、DailyOmni (视频理解)、VoiceBench (语音理解)、MediaPerf（行业基准测试）；
推理成本：在MediaPerf基准测试中实现最低的视频级标注成本。

GPU支持：官方主要优化了 NVIDIA Ampere、Hopper、Blackwell 架构的企业级GPU。消费级的RTX 30/40/50系列同样支持，可运行4位或5位量化版本。
量化与内存要求：原始模型需大量显存，但经过4-bit量化后内存需求大幅降低。使用4位量化，运行大约需要 25 GB 的统一内存或显存。
其他注意事项：内存建议至少24GB，推荐 RTX 3090/4090 等高端大显存型号。部署建议搭配 32GB 系统内存。