DALL·E 2 是由 OpenAI 公司所開發的 AI 文生圖程式, OpenAI 同時也開發了另一個熱門的產品 ChatGPT ,應該不少人聽過。本篇文章介紹 DALL·E 2 這個網站的基本資訊、操作教學,以及一些實測和使用心得。

基本資訊

網址: DALL·E 2 官網
試用:註冊後可獲得 50 點數,每個月會有 15 點數可以試用,免費點數一個月後會過期,不能累積。
付費方案:購買點數, 15 USD 可以買 115 點,生成一次一點。
解析度: 1024x1024
運算速度:大多 10 秒多,有時會到四五十秒
浮水印:右下角有浮水印,需自行移除
商業使用:可以
摘錄官方部落格:

Using DALL·E for commercial projects
Starting today, users get full usage rights to commercialize the images they create with DALL·E, including the right to reprint, sell, and merchandise. This includes images they generated during the research preview.

FAQ也有提到

功能介紹

註冊完成進入網頁之後可以看到下面的畫面,右上點開可以看到有多少點數,例如畫面中 Buy Credits 左邊的 50 點。
DALL·E 2 首頁

中間輸入匡輸入你想要生成的圖片點擊 Generate 送出,等待一段時間就會產生圖片了,例如下面的結果:
DALL·E 2 文生圖

一次會產生四個圖片,右邊會有歷史記錄,或者點擊左上方的 History 也可找到之前產生的。產生一次花費 1 點。

點擊生成的圖片可以打開下面的畫面,可以下載、生成其他變形或是編輯等不同操作。
圖片詳細

點擊 Variations 以當前圖片為基礎產生更多圖片,同樣會花費 1 點。完成後會出現下面畫面,這次好像等了更久,約 20 秒。
DALL·E 2 Variations

另外也可以編輯圖片,例如下面我把頭部清除,加上文字描述讓他重新生成頭部,重新生成「金髮戴著紅框墨鏡」。
編輯圖片

產生新的結果,可以選擇是否接受,無論是否接受都會花費 1 點。不過他一樣是會生成 4 張圖,下面的左右箭頭可以切換。
編輯結果

再試一次,成功的產生金髮紅框墨鏡。
編輯結果

最後是上傳圖片編輯生成,在首頁的輸入匡下面點擊 upload an image,會出現一個裁切視窗。現在裁切會自動縮放到 1024x1024 ,或者略過裁切後面再選取區域。
DALL·E 2 上傳圖片

我們從網路上找了一個戴口的美女,來試試看 AI 幫我們腦補的口罩下是什麼樣子。
編輯圖片

產生的四張中挑了一張比較好看的,大家覺得效果如何?
編輯結果

利用編輯圖片功能也可以延伸圖片。
延伸圖片

延伸出對面坐了一個人,效果感覺還不錯。不過要注意,也要選到一部分的原始圖片,讓他作為基礎去延伸。
延伸圖片結果

由於 DALL·E 2 圖片一律使用 1024x1024 解析度儲存,所以在歷史紀錄裡只會有延伸產出的四個小圖,只能在編輯畫面右上角下載當前的完整大圖。

實測

以下是我想的一些測試項目:

  • 文字產生圖片
    1. 簡易主題自由發揮
    2. 明確的指示畫面內容
      1. 寫實風格
      2. 動漫風格
      3. 畫家風格
    3. 抽象的指示
  • 圖片產生圖片
    1. 替換風格
    2. 替換動作
    3. 替換人事物
  • 局部圖片修改

文字產生圖片

簡易主題自由發揮

輸入: A superhero is fighting the bad guys
輸出:
DALL·E 2 文生圖

時間: 10 秒左右
這是上面那個範例,結果我覺得很不行啊。

明確的指示畫面內容

這邊以這張電影海報作為範本,看能不能靠文字叫AI產生出來。
目標範本

寫實風格

輸入: Keanu Charles Reeves is wearing a silver-gray suit, holding a gun in his right hand and pointing to the front left. The left hand is clenched and placed next to the thigh, looking forward to the left. Full body shot facing the camera. The background is a mottled silver-gray wall.
輸出:
DALL·E 2 文生圖寫實風格

時間: 15 秒
這結果…看來 AI 不認識基努李維

動漫風格

輸入: Keanu Charles Reeves is wearing a silver-gray suit, holding a gun in his right hand and pointing to the front left. The left hand is clenched and placed next to the thigh, looking forward to the left. Full body shot facing the camera. The background is a mottled silver-gray wall. Use anime style.
輸出:
DALL·E 2 文生圖動漫風格

時間: 50 秒
AI 變聰明了,頭都切掉就不怕不像基努李維了,不過說是動漫風格好像也不太像。

畫家風格

輸入: Keanu Charles Reeves is wearing a silver-gray suit, holding a gun in his right hand and pointing to the front left. The left hand is clenched and placed next to the thigh, looking forward to the left. Full body shot facing the camera. The background is a mottled silver-gray wall. Use Van Gogh style.
輸出:
DALL·E 2 文生圖畫家風格

時間: 16 秒
這次看來是 AI 不認識梵谷

抽象的指示

輸入: Facing challenges
輸出:
DALL·E 2 文生圖抽象的指示
看起來好像有意思到

更多測試

後來覺得上面指令可能太複雜, AI 無法正常運作。這次先重新從簡單一點的開始測試。

先直接給個人名
輸入: Keanu Charles Reeves portrait photo
輸出:
DALL·E 2 文生圖寫實風格

這是 AI 隨機生成還是直接吐照片出來?

加上畫家風格看看
輸入: Keanu Charles Reeves portrait in Van Gogh style
輸出:
DALL·E 2 文生圖畫家風格

這個效果就相當不錯。

改成動畫風格
輸入: Keanu Charles Reeves portrait in anime style
輸出:
DALL·E 2 文生圖動畫風格

看起來也還不錯,但比較像電腦繪圖,不是一般日本動漫的感覺。

試著讓他開槍
輸入: Keanu Charles Reeves jumping on the streets of Taipei
輸出:
DALL·E 2 文生圖
不知道是不是不能算出人拿槍的樣子。

加上背景看看
輸入: Keanu Charles Reeves jumping on the streets of Taipei
輸出:
DALL·E 2 文生圖跳躍

動作和背景可以,但人物就變得很奇怪,似乎畫面一複雜就不太行了。

試著不指定人物
輸入: A beautiful woman with long hair drinking coffee in a café
輸出:
DALL·E 2 文生圖咖啡廳

又產生了不錯的結果,所以是同時指定人物會造成混亂?

交叉測試
輸入: A beautiful woman with long hair jumps on the streets of Taipei
輸出:
DALL·E 2 文生圖跳躍

和指定人物沒關係,大概單純在街頭跳躍就不知道怎麼畫。

試著畫畫風景
輸入: There is a grand river beneath the galaxy
輸出:
DALL·E 2 文生圖風景
效果可以。

圖片產生圖片

DALL·E 2 不支援這個功能,就不進行相關測試了。

局部圖片修改

支援生成的圖片或上傳圖片修改,如同前面介紹過的,個人覺得效果還不錯。

替換頭部
輸入: blonde hair wearing red frame sunglasses
輸出:
DALL·E 2 編輯圖片替換頭部

移除口罩
輸入: smiling pretty woman
輸出:
DALL·E 2 編輯圖片移除口罩

延伸圖片
輸入: A beautiful woman with long hair drinking coffee in a café
輸出:
DALL·E 2 編輯圖片延伸圖片

總結

DALL·E 2 操作起來蠻簡單的,但也沒有更進階的設定可以進行更複雜的生成。文字生圖的功能效果某些複雜的情況不太理想,也許是還沒找到更精確的用法,以後有找到的話再更新文章,一般簡易的用法效果倒是還不錯。修改圖片的功能倒是效果不錯,應該還可以再進行更多的應用。