
Google AI Studio 发布 Nano Banana Pro 完整开发者指南,包含思考能力、搜索基础、4K 输出和高级图像混合功能
Google AI Studio 发布了 Nano Banana Pro(Gemini 3 Pro Image)的完整开发者教程,向开发者介绍了这一下一代 AI 图像生成模型的先进功能。虽然 Flash 版本(Nano Banana)带来了速度和可负担性,但 Pro 版本引入了突破性功能,包括"思考"过程、搜索基础和令人惊叹的 4K 输出。
Nano Banana Pro 不仅仅是绘图——它还会思考。该模型可以在生成图像之前通过复杂的、扭曲的提示进行推理,开发者可以通过在思考配置中启用 include_thoughts=True 来窥探其思考过程。这种透明度帮助开发者理解模型如何解释请求,创造更协作的体验。
最具变革性的功能之一是搜索基础。Nano Banana Pro 可以访问 Google 搜索的实时数据,生成准确、最新的图像。例如,开发者可以要求它可视化当前的天气预报,模型将获取实时数据并创建相应的可视化。
对于印刷质量的图像,Nano Banana Pro 支持 4K 分辨率。虽然 1K 或 2K 图像的成本为 $0.134,但 4K 图像的成本为 $0.24(加上 token 成本),为开发者提供专业级输出选项。
该模型可以在十多种语言中生成和翻译图像中的文本,作为视觉内容的通用翻译器。开发者可以用一种语言创建信息图表,然后将其翻译成另一种语言,同时保持相同的视觉设计。
虽然 Flash 模型最多可以混合 3 张图像,但 Pro 模型可以同时处理多达 14 张图像。此功能非常适合创建复杂的拼贴画或在一次生成中展示整个产品线。
开发者可以通过 Google AI Studio 访问 Nano Banana Pro,使用 Google 账号登录,然后从模型选择器中选择"Nano Banana Pro (Gemini 3 Pro Image)"。与 Flash 版本不同,Pro 版本需要在 Google Cloud 项目上启用计费。
教程涵盖:
教程展示了几个 Pro 专属功能:
指南强调了几种关键的提示策略:
使用 Nano Banana Pro 进行图像生成比 Flash 版本更昂贵,特别是对于 4K 图像。开发者可以通过使用批量 API节省 50% 的生成成本,尽管这可能需要等待最多 24 小时才能获得结果。
教程包含以下链接:
Nano Banana Pro 为 AI 图像生成开辟了新领域,结合了思考能力、实时搜索集成和专业级输出质量。它是为需要高级功能来完成复杂创意任务的严肃创作者设计的工具。
加入我们的社区
订阅邮件列表,及时获取最新消息和更新