平台核心能力与示例

以下展示了 Gemini 3 在多项权威测试与真实案例中的表现。

ARC-AGI-2 实测

在超高难度的通用智力测试ARC-AGI-2上，开启思考模式的Gemini 3.0准确率接近35%，而其他模型均在20%以下。

在号称最难的“人类最后考试HLE基准”上，Gemini 3.0拿下了32.4%最高分，性能碾压GPT-5（high）和Grok 4。

Gemini 3.0对各种图片（包括SVG矢量图）得心应手。对于著名SVG测试——骑自行车的鹈鹕，Gemini 3.0 Pro的输出一整个令网友惊叹。

之前很难的高达机器人和Switch手柄渲染图，Gemini 3.0 Pro这次的升级肉眼可见（和真实产品图相当接近）。

Gemini 3.0 Pro 在coding竞技场遥遥领先。

Gemini 3 已成为超级智能，Gemini 系列取得了飞跃式的进步。

Gemini 3.0 Pro 根据 prompt（the Power Rangers standing in the scene with typical poses the power rangers do）生成的图片。