2026060509:54星期五 申请收录 标签云 工具箱
当前位置:首页资讯详情页

谷歌Gemma 4 12B炸场:16G笔记本就能跑,性能碾压26B巨兽!

资讯 admin 2026-06-05 2

16GB内存的笔记本,就能跑出千亿级AI的效果?

谷歌刚刚做到了。

就在今天,Google DeepMind发布Gemma 4 12B,全球下载量已突破1.5亿次。DeepMind CEO亲自下场庆功。

这个模型最狠的地方在于:你不需要花一分钱买云服务,一台普通笔记本就能全离线跑通。

一、实测数据有多炸?

单张RTX 4090测试,Gemma 4 12B跑出了80 token/s的速度,生成8.9k token的复杂物理代码。

而它的"大哥"26B模型,虽然跑到了138 token/s,但吃掉了15GB显存。

12B只用了9GB显存,几乎打出了同等质量的战绩。

参数差了140亿,性能差距却微乎其微。评测机构atomic.chat直接封它为"16GB内存笔记本的本地部署完美神机"。

二、凭什么这么猛?

秘密在于谷歌这次砍掉了一个"中间商"。

过去多模态模型是"缝合怪"——图片要经过视觉编码器翻译,声音要经过音频编码器翻译,再喂给大脑。又慢又占内存。

Gemma 4 12B直接把编码器砍了。 原始图像和音频直接喂进模型,没有中间商赚差价。

延迟大幅降低,微调也变简单了——一次前向传递就能同时更新所有模态。

三、普通人能用吗?

Apache 2.0开源协议,商用免费,不收一分钱版权费。

MacBook Pro、RTX 4060以上的游戏本,统统能跑。

Ollama、LM Studio几条命令就能启动,甚至能在本地跑Python代码画图表,全程断网,隐私零泄露。

四、这意味着什么?

过去两年,所有巨头都在卷参数、卷云端算力。

但闭源实验室运送的是智力,开源权重运送的是杠杆。

一个能塞进笔记本的前沿级模型,才是真正的科技普惠。

当AI从云端降落到每个人的书桌上,属于超级个体的大爆炸才刚刚开始。

你觉得,本地AI会取代云端API吗?

相关文章