Stable Diffusion 是由 StabilityAI 公司所開發的模型。由於 Stable Diffusion 是開源的,所以可以找到許多線上 AI 藝術生成服務使用這個模型。而官方推出的線上服務是 DreamStudio 這個產品,本篇文章將介紹這個網站基本資訊、操作教學,以及一些實測和使用心得。

基本資訊

網址: StabilityAI 官網 或直接連 DreamStudio
試用:註冊後可獲得100點數。
付費方案: 10 美金可購買 1000 點,生成圖片可選擇不同屬性,依據不同設定扣點不同,預設設定一張圖 0.2 。
解析度:最大 1024x1024 ,長寬可自訂介於 512-1024 。
運算速度: 5-10 秒
浮水印:無
商業使用:可以,參考 FAQ

功能介紹

註冊完成進入網頁之後可以看到下面的畫面,右側可以選擇尺寸 (Width 和 Height)、生成張數 (Number of Images) 和其他複雜的設定,上方可以看到設定所需花費的短數。我們先用預設值來試試看:
DreamStudio 首頁

預設產生四張圖,其中一張不知為何產生出模糊不清的圖片,右側可以下載全部圖片,或者點擊圖片可以下載或進一步操作。
DreamStudio 文生圖

點擊圖片後,他其實是利用右側功能的選取圖片,可以進行以圖生圖的操作。
選取圖片

或者點擊圖片上的編輯圖示或右下的 Show Editor 按鈕,可以進入編輯圖片模式。
DreamStudio 圖片編輯器

我們先按 Back 離開編輯模式,先試試看圖生圖的功能。在不修改文字的情況下直接送出,相當於依照當前圖片產生變化圖。
DreamStudio 圖生圖

試著以這張圖加上 “The background is space” 的要求,看起來確實變成太空,但前面的角色變化似乎有點大。
DreamStudio 圖生圖加上描述

接著看看 History 功能,結果發現圖片縮圖很糊之外,不能下載原始圖片和編輯,點擊圖片的 Redream 只是跳回首頁帶入之前的文字…所以生成的圖片要下載下來。
DreamStudio History

試試編輯圖片,一樣用口罩來試試。
編輯圖片

把口罩移除掉加上 smiling pretty woman 的描述。
編輯圖片

生成的過程出現錯誤訊息,根據說明似乎是判斷為產生禁止的圖片,所以被打碼了,不過不會扣點。
DreamStudio 生成錯誤訊息

結果…感覺有點可怕啊。
DreamStudio 編輯圖片結果

使用 Keanu Charles Reeves portrait photo 來測試不同的 Cfg Scale, Cfg Scale 0 ,完全和我送的文字無關了。
DreamStudio 設定 Cfg Scale 0

預設值 Cfg Scale 7
DreamStudio 設定 Cfg Scale 7

Cfg Scale 20
DreamStudio 設定 Cfg Scale 20

預設值 Cfg Scale 7,使用 Stable Diffusion v2.1 Model
DreamStudio 使用 Stable Diffusion v2.1 Model

實測

文字產生圖片

簡易主題自由發揮

輸入: A superhero is fighting the bad guys
輸出:
DreamStudio 文生圖簡易主題自由發揮

感覺畫的比 DALL·E 2 好一些

明確的指示畫面內容

一樣採用上次的目標
輸入: Keanu Charles Reeves is wearing a silver-gray suit, holding a gun in his right hand and pointing to the front left. The left hand is clenched and placed next to the thigh, looking forward to the left. Full body shot facing the camera. The background is a mottled silver-gray wall.
輸出:
DreamStudio 文生圖明確的指示畫面內容

比起 DALL·E 2 效果好,左下那張蠻接近目標,不過材質看起來很像蠟像

抽象的指示

輸入: Facing challenges
輸出:
DreamStudio 文生圖抽象的指示

完全不知道在畫什麼…

風格測試

寫實風格

輸入: Keanu Charles Reeves portrait photo
輸出:
DreamStudio 文生圖寫實風格

上面已經產生過了,蠻像的。

動漫風格

輸入: Keanu Charles Reeves portrait in anime style
輸出:
DreamStudio 文生圖動漫風格

感覺畫得不錯。

畫家風格

輸入: Keanu Charles Reeves portrait in Van Gogh style
輸出:
DreamStudio 文生圖畫家風格

一樣效果不錯。

試試看七龍珠風格
輸入: painting of Keanu Charles Reeves in Dragon Ball style
輸出:
DreamStudio 文生圖七龍珠風格

左邊兩張好像還可以。

風景測試

輸入: There is a grand river beneath the galaxy
輸出:
DreamStudio 文生圖風景測試

看起來蠻漂亮的。

圖片產生圖片

風格替換

使用上次的照片來測試
咖啡聽

輸入: A beautiful woman with long hair drinking coffee in a café, in Van Gogh style
輸出:
DreamStudio 圖生圖風格替換

結果沒有如預期的替換風格,試過其他不同輸入也沒辦法成功。

動作替換

輸入: A beautiful woman with long hair eat cake
輸出:
DreamStudio 圖生圖動作替換

左上角好像有成功替換,雖然蛋糕長得不太像。

人物替換

輸入: Gal Gadot drinking coffee in a café
輸出:
DreamStudio 圖生圖人物替換

看起來有成功,不過左下那個怎麼ㄎㄧㄤ掉。

總結

文生圖基本功能還可以,但還是無法完成複雜指令。圖片編輯功能不好用,無法縮放畫布,不好擦除,產出效果不好。圖生圖除了風格無法替換之外,可以替換人物和物品之類,效果不錯。產圖速度快,但是圖片有時會失敗。參數多樣,可以下更複雜的指令,一般 Cfg Scale 使用 7-8 效果最好。最大缺點是歷史紀錄,產生過的圖沒辦法在網站上重新找到,或是代入編輯。