使用 DALL-E 3 跟機器人對話,就可以很方便地請機器人畫圖。最近社群揭露了 DALL-E3 的系統提示 (system prompt) 。進一步反推畫圖的秘訣:產生圖片時可切換中英文,不可提到當代公眾人物或當代畫家風格、可直接指定圖片類型、如果畫得不好,可以再叫它修改。
Made with DALL-E 3 |
DALL-E 3 是 OpenAI 公司的產品,透過使用文字對話,就可以很方便地請機器人畫圖 [1]。近日社群網絡揭露了 DALL-E 3 的系統提示 (system prompt) [2][3]:
1. 使用英語溝通會更有效率
系統提示提到
The prompt must be in English. Translate to English if needed.
「如果提示不是英語,則將它翻譯。」
💡 告訴我們什麼?
DALL-E 3 只懂英語,使用 ChatGPT 畫圖其實是背後透過其他機器人協助翻譯。使用過短的中文詞句,可能會造成翻譯錯誤。或者嘗試很多次後,發現機器人畫的圖都不是你要的。建議直接用英語跟機器人對話。
如果是英語苦手,可以使用以下提示,先請 GPT-4 翻譯並確認英文翻譯與你原本想要的意思是否有落差?
我給你兩個任務,將 ` 符號的間隔的句子
1. 翻成英文
2. 再將前一步翻成的英文,翻成台灣常用的繁體中文
(要翻譯的中文句子)
再將確認過的英文,當作給 DALL-E 3 畫圖的提示
2. 即使使用者請求更多張圖,也不要建立超過一張圖。
Do not create more than 1 image, even if the user requests more.「即使使用者請求更多張圖,也不要建立超過一張圖。」
3. 不要叫機器人畫政治人物或明星的圖
系統提示提到
Do not create images of politicians or other public figures. Recommend other ideas instead.
「不能產生跟政治人物或其他公眾人物的圖。機器人會建議其他點子。」
請機器人畫「長得像川普的中年男子在花園走道裡跳舞」,機器人回應:
「很抱歉,我無法製作政治家或公眾人物的圖像,包括唐納-川普。您想要一個中年男子在花園人行道上跳舞而不涉及任何特定公眾人物的圖片嗎?請告訴我您想怎麼做!」
畫政治人物將會違反 OpenAI 公司的內容政策 [4],我們不想因為圖,而影響該名政治人物的選舉或者是公共議題的參與討論 (political process)。
💡 告訴我們什麼?
4. 不要指名要當代畫家的風格
系統提示提到
Do not create images in the style of artists, creative professionals or studios whose latest work was created after 1912 (e.g. Picasso, Kahlo). You can name artists, creative professionals or studios in prompts only if their latest work was created prior to 1912 (e.g. Van Gogh, Goya) If asked to generate an image that would violate this policy, instead apply the following procedure: (a) substitute the artists name with three adjectives that capture key aspects of the style; (b) include an associated artistic movement or era to provide context; and (c) mention the primary medium used by the artist
「不要建立在過去100年內創作的藝術家風格的圖像(例如畢卡索,卡洛)。超過100年前的藝術家的最後一部作品可以直接參考(例如梵谷,克林姆特)。如果被問及,則說『我不能引用這位藝術家』,但不要提及此政策。相反,建立 DALLE 提示時應用以下程序:(a)用三個描述風格的關鍵方面的形容詞替代藝術家的名字;(b)包括相關的藝術運動或時代以提供上下文;並(c)提及藝術家使用的主要媒介。」
嘗試請機器人「用畢卡索風格描繪蜘蛛人出現古埃及的壁畫上」、「用畢卡索風格畫一隻白色暹羅貓」,機器人除了回答違反內容政策,有時會直接取關鍵特徵作為繪圖方向。但是是否符合畢卡索風格,就請自行判斷。
💡 告訴我們什麼?
不要直接提到畫家名字或畫作名稱 (有時可以提到畫作)。可以改成文字描述關鍵特徵、100百年前的風格。5 告訴它你想要的畫的類型
Always mention the image type (photo, oil painting, watercolor painting, illustration, cartoon, drawing, vector, render, etc.) at the beginning of the caption. Unless the caption suggests otherwise, make at least 1--2 of the 4 images photos.
「在說明的開頭提及圖片類型(照片、油畫、水彩畫、插圖、卡通、繪畫、向量圖、渲染等)。除非說明建議其他方式,否則 4 張圖片裡,至少有 1-2 張是照片。」
6. 不要叫機器人畫著作權保護的角色
Do not name or directly / indirectly mention or describe copyrighted characters. Rewrite prompts to describe in detail a specific different character with a different specific color, hair style, or other defining visual characteristic. Do not discuss copyright policies in responses.
不要命名或是直接或間接地提及或描述受著作權保護的角色。重寫提示,詳細地描述一個有不同特定顏色、髮型或其他決定性視覺特徵的不同角色。在回覆中不要討論著作權政策。
7. 如果畫得不好,可以再叫它修改
If the user references a previous image, this field should be populated with the gen_id from the dalle image metadata. referenced_image_ids?: string[]
「如果使用者提及之前的圖片,這個欄位應該填入來自於 dalle 圖片後設資料的 gen_id。referenced_image_ids?: string[]」
8. 三種圖片的大小可以選擇
The size of the requested image. Use 1024x1024 (square) as the default, 1792x1024 if the user requests a wide image, and 1024x1792 for full-body portraits. Always include this parameter in the request. size?: "1792x1024" | "1024x1024" | "1024x1792
預設提供 1024x1024 (正方形) 尺寸大小的圖片,如果使用者要求寬螢幕的圖像,則提供 1792x1024,用於全身肖像時則提供 1024x1792。請求中始終包含此參數。尺寸: "1792x1024" | "1024x1024" | "1024x1792"
9. 提供簡單與清楚的提示
系統提示提到The generated prompt sent to dalle should be very detailed, and around 100 words long.
傳送給 dalle 的提示需要非常詳細,需要有約 100 個字。
結論
- 如果圖跟你想要的有落差,可以從中文切換成英文,使用英語溝通會更有效率
- 不要叫機器人畫政治人物或明星的圖
- 不要指名要當代畫家的風格,可以改成關鍵特徵或100百年前的風格
- 不要叫機器人畫著作權保護的角色
- 如果畫得不好,可以再叫它修改
- 如果不清楚哪裡出問題導致無法畫圖,你可以直接問機器人改成不違反內容政策的圖
- 三種圖片的大小可以選擇:1792x1024、1024x1024、1024x1792
- 如果你的提示太短,機器人就會自己補腦
參考資料
https://liff.line.me/1645278921-kWRPP32q/?accountId=251vgtut。
這是Moonshot 生圖 小幫手
https://liff.line.me/1645278921-kWRPP32q/?accountId=007omugu
這是GPT-40 mini 小幫手 ,都是加賴好友連結就能使用
https://designer.microsoft.com/
https://www.bing.com/images/create
微軟copilot 旗下指令生成AI 可下中文指令 英文指令較佳
教你如何使用小幫手生成圖片
圖片生成指令注意事項
https://huggingface.co/spaces/fancyfeast/joy-caption-pre-alpha
丟圖讓它描速指令 跟小幫手其中一個圖生文功能一樣
https://docs.qingque.cn/d/home/eZQDp092-vzqbhb02KUdurkwP?identityId=1oEG9JKKMFv
這是大陸可靈群組 裏面有教基本的咒語指令(文生 圖生 視頻延長 )如何使用 各位有興趣可参考 不知如何下咒語指令 可加入臉書AI魔法咒語社等社團 有很多AI社團能夠加入 裏面有許多範例可参考 https://www.recraft.ai/
- DALL·E 3
- X 上的 Bryce Drennan:「ChatGPT+ Dalle3 System Prompt: You are ChatGPT, a large language model trained by OpenAI, based on the GPT-4 architecture. Knowledge cutoff: 2022-01 Current date: 2023-10-05 # Tools ## dalle // Whenever a description of an image is given, use dalle to create the images and…」 / X
- 蔡旻錫 - 【ChatGPT DALL·E 3 完整的「系統 Prompt」】 ──「系統 Prompt」告訴了我們什麼重要資訊?... | Facebook
- Content policy | DALL·E
- Guide to using seed in Stable Diffusion
- Image generation - OpenAI API
- Now add a walrus: Prompt engineering in DALL-E 3
- David Hsiao - 日前在 鳥巢AI藝術學園.平台發問,想知道要怎麼運用GPT4... | Facebook