DreamStudio - AI藝術生成器基本教學
Stable Diffusion 是由 StabilityAI 公司所開發的模型。由於 Stable Diffusion 是開源的,所以可以找到許多線上 AI 藝術生成服務使用這個模型。而官方推出的線上服務是 DreamStudio 這個產品,本篇文章將介紹這個網站基本資訊、操作教學,以及一些實測和使用心得。
基本資訊
網址: StabilityAI 官網 或直接連 DreamStudio
試用:註冊後可獲得100點數。
付費方案: 10 美金可購買 1000 點,生成圖片可選擇不同屬性,依據不同設定扣點不同,預設設定一張圖 0.2 。
解析度:最大 1024x1024 ,長寬可自訂介於 512-1024 。
運算速度: 5-10 秒
浮水印:無
商業使用:可以,參考 FAQ
功能介紹
註冊完成進入網頁之後可以看到下面的畫面,右側可以選擇尺寸 (Width 和 Height)、生成張數 (Number of Images) 和其他複雜的設定,上方可以看到設定所需花費的短數。我們先用預設值來試試看:
預設產生四張圖,其中一張不知為何產生出模糊不清的圖片,右側可以下載全部圖片,或者點擊圖片可以下載或進一步操作。
點擊圖片後,他其實是利用右側功能的選取圖片,可以進行以圖生圖的操作。
或者點擊圖片上的編輯圖示或右下的 Show Editor 按鈕,可以進入編輯圖片模式。
我們先按 Back 離開編輯模式,先試試看圖生圖的功能。在不修改文字的情況下直接送出,相當於依照當前圖片產生變化圖。
試著以這張圖加上 “The background is space” 的要求,看起來確實變成太空,但前面的角色變化似乎有點大。
接著看看 History 功能,結果發現圖片縮圖很糊之外,不能下載原始圖片和編輯,點擊圖片的 Redream 只是跳回首頁帶入之前的文字…所以生成的圖片要下載下來。
試試編輯圖片,一樣用口罩來試試。
把口罩移除掉加上 smiling pretty woman 的描述。
生成的過程出現錯誤訊息,根據說明似乎是判斷為產生禁止的圖片,所以被打碼了,不過不會扣點。
結果…感覺有點可怕啊。
使用 Keanu Charles Reeves portrait photo 來測試不同的 Cfg Scale, Cfg Scale 0 ,完全和我送的文字無關了。
預設值 Cfg Scale 7
Cfg Scale 20
預設值 Cfg Scale 7,使用 Stable Diffusion v2.1 Model
實測
文字產生圖片
簡易主題自由發揮
輸入: A superhero is fighting the bad guys
輸出:
感覺畫的比 DALL·E 2 好一些
明確的指示畫面內容
一樣採用上次的目標
輸入: Keanu Charles Reeves is wearing a silver-gray suit, holding a gun in his right hand and pointing to the front left. The left hand is clenched and placed next to the thigh, looking forward to the left. Full body shot facing the camera. The background is a mottled silver-gray wall.
輸出:
比起 DALL·E 2 效果好,左下那張蠻接近目標,不過材質看起來很像蠟像
抽象的指示
輸入: Facing challenges
輸出:
完全不知道在畫什麼…
風格測試
寫實風格
輸入: Keanu Charles Reeves portrait photo
輸出:
上面已經產生過了,蠻像的。
動漫風格
輸入: Keanu Charles Reeves portrait in anime style
輸出:
感覺畫得不錯。
畫家風格
輸入: Keanu Charles Reeves portrait in Van Gogh style
輸出:
一樣效果不錯。
試試看七龍珠風格
輸入: painting of Keanu Charles Reeves in Dragon Ball style
輸出:
左邊兩張好像還可以。
風景測試
輸入: There is a grand river beneath the galaxy
輸出:
看起來蠻漂亮的。
圖片產生圖片
風格替換
使用上次的照片來測試
輸入: A beautiful woman with long hair drinking coffee in a café, in Van Gogh style
輸出:
結果沒有如預期的替換風格,試過其他不同輸入也沒辦法成功。
動作替換
輸入: A beautiful woman with long hair eat cake
輸出:
左上角好像有成功替換,雖然蛋糕長得不太像。
人物替換
輸入: Gal Gadot drinking coffee in a café
輸出:
看起來有成功,不過左下那個怎麼ㄎㄧㄤ掉。
總結
文生圖基本功能還可以,但還是無法完成複雜指令。圖片編輯功能不好用,無法縮放畫布,不好擦除,產出效果不好。圖生圖除了風格無法替換之外,可以替換人物和物品之類,效果不錯。產圖速度快,但是圖片有時會失敗。參數多樣,可以下更複雜的指令,一般 Cfg Scale 使用 7-8 效果最好。最大缺點是歷史紀錄,產生過的圖沒辦法在網站上重新找到,或是代入編輯。