
平台核心能力与示例
以下展示了 Gemini 3 在多项权威测试与真实案例中的表现。

ARC-AGI-2 实测
在超高难度的通用智力测试ARC-AGI-2上,开启思考模式的Gemini 3.0准确率接近35%,而其他模型均在20%以下。

HLE 基准最高分
在号称最难的“人类最后考试HLE基准”上,Gemini 3.0拿下了32.4%最高分,性能碾压GPT-5(high)和Grok 4。

SVG 鹈鹕测试
Gemini 3.0对各种图片(包括SVG矢量图)得心应手。对于著名SVG测试——骑自行车的鹈鹕,Gemini 3.0 Pro的输出一整个令网友惊叹。

高达与手柄渲染
之前很难的高达机器人和Switch手柄渲染图,Gemini 3.0 Pro这次的升级肉眼可见(和真实产品图相当接近)。

Coding 竞技场领先
Gemini 3.0 Pro 在coding竞技场遥遥领先。

系列飞跃式进步
Gemini 3 已成为超级智能,Gemini 系列取得了飞跃式的进步。

Prompt 生成示例
Gemini 3.0 Pro 根据 prompt(the Power Rangers standing in the scene with typical poses the power rangers do)生成的图片。
参考:《前端危!Gemini 3内测结果获网友一致好评,“有史以来最强前端开发模型”》,以上案例与数据均来源或整理自该文与社区实测。