# Nano Banana Pro 完整開發者教學 (Complete Developer Tutorial for Nano Banana Pro)
來源:https://x.com/googleaistudio/article/1992267030050083091
探索這款下一代 AI 模型如何透過其進階功能,包括思考、搜尋建立基準和令人驚嘆的 4K 輸出,讓您能夠建構複雜且富有創意的應用程式。
Flash 模型 (Nano Banana) 帶來了速度和經濟實惠,而 Pro 版本則引入了「思考」能力、搜尋建立基準和高傳真 4K 輸出。是時候用複雜的創意任務來大展身手了!
本指南將引導您使用 [Gemini Developer API](https://ai.google.dev/) 來了解 Nano Banana Pro 的進階功能。
本指南將涵蓋:
1. 在 Google AI Studio 中使用 Nano Banana Pro
2. 專案設定
3. 初始化用戶端
4. 基本生成 (經典)
5. 「思考」過程
6. 搜尋建立基準
7. 高解析度 4K 生成
8. 多語言功能
9. 進階圖像混合
10. Pro 獨家示範
11. 最佳實踐和提示技巧
> **注意**:如需此文章的互動版本,請查看 [Python cookbook](https://colab.sandbox.google.com/github/google-gemini/cookbook/blob/main/quickstarts/Get_Started_Nano_Banana.ipynb) 或 AI Studio 的 [Javascript Notebook](https://aistudio.google.com/apps/bundled/get_started_image_out?fullscreenApplet=true&showPreview=true&showAssistant=true)。
# 1. 在 Google AI Studio 中使用 Nano Banana Pro
雖然使用者 (end-user) 可以在 [gemini](https://gemini.google.com/) 中存取 Nano Banana Pro,但開發人員原型設計和測試提示的最佳環境是 [AI Studio](https://aistudio.google.com/banana-pro)。AI Studio 是一個實驗所有可用 AI 模型的地方,然後再編寫任何程式碼,它也是使用 Gemini API 進行建構的入口點。
您可以在 AI Studio 中使用 Nano Banana Pro。若要開始使用,請前往 https://aistudio.google.com/banana-pro ,使用您的 Google 帳戶登入,然後從模型選擇器中選取 **Nano Banana Pro** (Gemini 3 Pro Image)。
與 Nano-Banana 不同,Pro 版本**沒有免費方案**,這表示您需要選擇一個已啟用計費功能的 API 金鑰 (請參閱下面的「專案設定」部分)。
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992261429228130304)
> 提示:您也可以直接在 AI Studio 的 https://ai.studio/apps 中編寫 Nano Banana 網路應用程式的程式碼,或探索程式碼並重新混合其中一個[現有 app](https://aistudio.google.com/apps?source=showcase&showcaseTag=nano-banana)。
# 2. 專案設定
若要遵循本指南,您需要以下內容:
* 來自 [Google AI Studio](https://aistudio.google.com/) 的 API 金鑰。
* 為您的專案設定計費功能。
* 適用於 [Python](https://github.com/googleapis/python-genai) 或 [JavaScript/TypeScript](https://github.com/googleapis/js-genai) 的 Google Gen AI SDK。
如果您已經是擁有所有這些的 Gemini API 鐵粉,太棒了!只需跳過此部分並移至下一部分。否則,以下是入門方法:
## 步驟 A:取得您的 API 金鑰
當您首次登入 AI Studio 時,應該會自動建立 Google Cloud 專案和 API 金鑰。
開啟 [API key management screen](https://aistudio.google.com/api-keys) 並點選「複製」圖示以複製您的 API 金鑰。
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992261639320809472)
## 步驟 B:啟用帳單服務
由於 Nano Banana Pro 沒有免費方案。您必須在 Google Cloud 專案中啟用計費功能。
在 [API key management screen](https://aistudio.google.com/projects) 中,點選專案旁邊的「**設定計費功能**」並按照螢幕上的說明操作。
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992261573390528512)
**Nano Banana Pro 的費用是多少?**
使用 Nano Banana Pro 生成圖像比 Flash 版本更昂貴,尤其是 4K 圖像。在發布此文章時,1K 或 2K 圖像的費用為 0.134 美元,而 4K 圖像的費用為 0.24 美元 (加上輸入的代幣成本和文字輸出)。
請查看文件中的 [pricing](https://ai.google.dev/gemini-api/docs/pricing#gemini-3-pro-image-preview) 以獲取最新詳細資訊。
> **專業提示**:為了節省 50% 的生成成本,您可以使用 [Batch API](https://ai.google.dev/gemini-api/docs/image-generation?batch=file#batch-api) 。作為交換,您可能需要等待長達 24 小時才能獲得圖像。
## 步驟 C:安裝 SDK
選擇您偏好的語言的 SDK。
**Python:**
```shell
pip install -U google-genai
# 安裝 Pillow 函式庫以進行圖像處理
pip install Pillow
```
**JavaScript / TypeScript:**
```shell
npm install @google/genai
```
> 注意:以下範例使用 Python SDK 進行示範。此 [JS Notebook](https://ai.studio/apps/bundled/get_started_image_out?fullscreenApplet=true) 中提供了在 JavaScript 中使用 Nano Banana 的等效程式碼片段。
# 3. 初始化客戶端
若要使用 Pro 模型,您需要使用 **gemini-3-pro-image-preview** 模型 ID。
```python
from google import genai
from google.genai import types
# 初始化用戶端
client = genai.Client(api_key="YOUR_API_KEY")
# 設定模型 ID
PRO_MODEL_ID = "gemini-3-pro-image-preview"
```
# 4. 基本生成(經典)
在我們深入研究花俏的東西之前,讓我們先看看標準生成。您可以使用 response_modalities (獲取文字和圖像或僅圖像) 和 aspect_ratio 來控制輸出。
```python
prompt = "建立一張逼真的暹羅貓圖像,左眼綠色,右眼藍色"
aspect_ratio = "16:9" # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9" 或 "21:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'], # 或僅 ['Image']
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
)
)
)
# 顯示圖像
for part in response.parts:
if image:= part.as_image():
image.save("cat.png")
```
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992263003157528576)
聊天模式也是一個選項 (實際上我會推薦用於多輪編輯)。請查看第 8 個範例「多語種香蕉」(Polyglot Banana) 以獲取範例。
# 5. 「思考」的過程
Nano Banana Pro 不僅僅是繪圖;它還會*思考*。這表示它可以在生成圖像之前,透過您最複雜、最扭曲的提示進行推理。最棒的是什麼?您可以窺探它的大腦!
若要啟用此功能,請在 thinking_config 中設定 include_thoughts=True。
```python
prompt = "建立一張不尋常但逼真,可能會爆紅的圖像"
aspect_ratio = "16:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
),
thinking_config=types.ThinkingConfig(
include_thoughts=True # 啟用思考
)
)
)
# 顯示圖像和思考
for part in response.parts:
if part.thought:
print(f"思考:{part.text}")
elif image:= part.as_image():
image.save("viral.png")
```
您應該會得到類似以下內容:
```shell
## 想像通勤的駱馬
我現在專注於駱馬。目標是將它們捕捉為
玻利維亞拉巴斯繁忙公車上的日常通勤者。我的計畫
涉及一輛擠滿了開心乘客的老式公車。圖像
將突出顯示細節,例如一隻駱馬望向窗外,
另一隻與乘客互動,同時人們正在
拍照。
[圖像]
## 視覺化概念
我現在完全沉浸在所要求的場景中。我的主要
重點是「不尋常但逼真」的方面。場景
開始形成,關鍵元素已建立。
```
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992263543102771200)
這種透明度有助於您了解模型如何解釋您的請求。這就像與您的藝術家進行對話!
# 6. 搜尋建立基準 (即時魔法)
最具顛覆性的功能之一是搜尋建立基準 (Search Grounding)。Nano Banana Pro 並沒有停留在過去;它可以存取 Google 搜尋的即時資料以生成準確、最新的圖像。想要天氣預報?沒問題。
例如,您可以要求它視覺化當前天氣預報:
```python
prompt = "將東京未來 5 天的天氣預報視覺化為簡潔、現代的天氣圖。並附上每天應該穿什麼的視覺效果"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="16:9",
),
tools=[{"google_search": {}}] # 啟用 Google 搜尋
)
)
# 儲存圖像
for part in response.parts:
if image:= part.as_image():
image.save("weather.png")
# 顯示來源 (您必須始終這樣做)
print(response.candidates[0].grounding_metadata.search_entry_point.rendered_content)
```
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992263744852983809)
# 7. 不成功便成仁:4K 世代
需要列印品質的圖像?Nano Banana Pro 支援 4K 解析度。因為有時候,越大越好。
```python
prompt = "一張橡樹經歷四季的照片"
resolution = "4K" # 選項:"1K"、"2K"、"4K",請注意小寫無效。
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="1:1",
image_size=resolution
)
)
)
```
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992263940576100352)
> **注意**:4K 生成的成本較高,因此請明智使用!
# 8. 多語種香蕉(多語言能力)
該模型可以生成甚至翻譯圖像中的文字,支援十多種語言。它基本上是您眼睛的通用翻譯器。
```python
# 生成西班牙語資訊圖表
message = "製作一張資訊圖表,解釋愛因斯坦的廣義相對論,適合六年級學生,使用西班牙語"
response = chat.send_message(message,
config=types.GenerateContentConfig(
image_config=types.ImageConfig(aspect_ratio="16:9")
)
)
# 儲存圖像
for part in response.parts:
if image:= part.as_image():
image.save("relativity.png")
```
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992264207719677952)
```python
# 將其翻譯成日語
message = "將此資訊圖表翻譯成日語,其他一切保持不變"
response = chat.send_message(message)
# 儲存圖像
for part in response.parts:
if image:= part.as_image():
image.save("relativity_JP.png")
```
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992264245409701889)
# 9. 混合一下! (進階圖像混合)
Flash 模型最多可以混合 3 張圖像,而 Pro 模型最多可以處理 14 張圖像!這簡直就是一個提示中的派對。非常適合建立複雜的拼貼畫或展示您的整個產品線。
```python
# 混合多張圖像
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=[
"這些人的辦公室團體照,他們正在做鬼臉。",
PIL.Image.open('John.png'),
PIL.Image.open('Jane.png'),
# ... 最多可添加 14 張圖像
],
)
# 儲存圖像
for part in response.parts:
if image:= part.as_image():
image.save("group_picture.png")
```
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992264496371675136)
> **注意**:如果您希望角色具有非常高的傳真度,請將自己限制在 5 個,這對於派對之夜來說已經足夠了!
# 10. 炫耀時間到了! (專業版獨家演示)
以下是一些只有 Nano Banana Pro 才能實現的範例。準備好驚嘆吧:
**個人化像素藝術(搜尋建立基準)**
> **提示**:「搜尋網路,然後生成一張等距透視、細緻像素藝術的圖像,展示 Guillaume Vernade 的職業生涯」
這使用搜尋建立基準來查找有關個人的特定資訊,並以特定風格將其視覺化。
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992264650231267328)
**複雜文本整合**
> **提示**:「向我展示一張關於十四行詩如何運作的資訊圖表,其中包含一首關於香蕉的十四行詩,以及對這首詩的冗長文學分析。具有良好的復古美學」
該模型可以生成連貫、冗長的文字,並將其完美地整合到複雜的佈局中。
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992264683932549120)
**高擬真模型**
> **提示**:「一張百老匯節目單的照片,關於 TCG 玩家坐在漂亮的劇院座位上,專業且製作精良,有光澤,我們可以看到封面和一頁顯示舞台照片。」
建立具有準確照明和紋理的印刷材料的逼真模型。
[](https://x.com/GoogleAIStudio/article/1992267030050083091/media/1992264718082519040)
# 11. Nano Banana 和 Nano Banana Pro 的最佳實踐和提示技巧
為了使用 Nano Banana 模型獲得最佳結果,請遵循以下提示指南:
**詳盡描述細節**:您提供的關於主題、顏色、照明和構圖的細節越多,您對輸出的控制就越多。
**說明上下文和意圖**:解釋圖像的目的或所需情緒。模型對上下文的理解將影響其創意選擇。
**反覆調整和完善**:不要期望第一次就完美。使用模型的對話能力進行增量更改並完善您的圖像。
**採用逐步說明**:對於複雜的場景,將您的提示分解為一系列清晰、連續的說明。
**以正面方式描述**:不要使用「沒有汽車」等負面提示,而是正面方式描述所需的場景:「一條空曠、荒涼的街道,看不見任何交通痕跡。」
**運用攝影術語**:使用攝影和電影術語來指導構圖,例如「廣角鏡頭」、「微距鏡頭」或「低角度透視」。
**利用搜尋建立基準**:當您知道希望模型使用即時或真實世界的資料時,請非常精確地說明。 「搜尋網路關於奧林匹克里昂隊上一場比賽的資訊,並製作一張資訊圖表」會比「一張關於 OL 上一場比賽的資訊圖表」效果更好 (後者仍然有效,但不要冒險)。
使用 [Batch API](https://ai.google.dev/gemini-api/docs/image-generation?batch=file#batch-api) 來降低成本並獲得更多配額:批次 API 是一種同時發送少量或大量請求的方式。它們可能需要長達 24 小時才能處理,但作為交換,您可以節省 50% 的生成成本。而且配額也更高!
如需深入了解最佳實踐,請查看文件中的 [prompting guide](https://ai.google.dev/gemini-api/docs/image-generation#prompt-guide) 和官方部落格上發布的 [prompting best practices](https://developers.googleblog.com/en/how-to-prompt-gemini-2-5-flash-image-generation-for-the-best-results/)。
Nano Banana Pro (Gemini 3 Pro Image) 為 AI 圖像生成開闢了新天地。憑藉其思考、搜尋和 4K 渲染的能力,它是嚴肅創作者 (和嚴肅樂趣) 的工具。
準備好嘗試了嗎?前往 [Google AI Studio](https://aistudio.google.com/) ,嘗試或自訂我們的 [Apps](https://aistudio.google.com/apps?source=showcase&showcaseTag=nano-banana) 或查看 [cookbook](https://colab.sandbox.google.com/github/google-gemini/cookbook/blob/main/quickstarts/Get_Started_Nano_Banana.ipynb)。