最近 AI 界開始流行一個新的代名詞:AIGC(Artificial Intelligence Generated Content),中文譯為「生成式 AI」,用來和以前一般概念的 AI 作區分。 AI 發展的速度可說是「一日千里」,AIGC 應用與議題也呈現爆炸式成長。去年二月時寫了一篇文章簡單介紹 Stable Deffusion 的 AI 繪圖功能,當時 WebUI 的某些項目仍不夠穩定,且時不時又跑出一堆新的插件和技術,覺得這發展的速度實在是快到難以跟上,所以就乾脆棄坑不追了,打算等著過一段時間、哪些功能成為主流了之後再來接觸學習。如今一年過去了,這一年的 AIGC 服務比起一年前更加百花齊放,使用上也更加方便、使用門檻也更低,是時候重新接觸這個議題了。
目前分類:工人智慧 (4)
- Apr 12 Fri 2024 14:25
【AIGC】真真假假,強大的 AI 工具 Fooocus
- Feb 19 Sun 2023 09:52
【人工智慧】AI 之狼來了:打造海量供應的製圖工廠(Stable-Diffusion-WebUI)
最近「AI」的議題非常的火紅,去年 11 月 ChatGPT 橫空出世,徹底顛覆以往人類對「人工智慧」的認知。我是這麼跟就讀高二的外甥女介紹 ChatGPT 的:請她打開高中數學課本,隨便找一條數學選擇題,將題目直接輸入到 ChatGPT 裡,過了幾秒鐘之後 ChatGPT 開始回答,一行一行清楚寫出解題步驟,最後還以人類的自然語法唸出來「所以這一題的答案是 A、C、 D」,標準答案完全正確,真的是「讓在場所有人全都驚呆了」,短短最近這一兩個月,「AI 」話題的熱度可說是與日俱增,發展的速度簡直跟火箭升空一樣,速度快到有點讓人跟不上,幾乎每隔幾天就可以聽到「AI」有甚麼樣新技術或是新應用。
而在「AI 繪圖」這個領域也很精彩,目前最知名的 AI 繪圖工具「Midjourney AI]僅須透過「提詞(Prompt)」描述的方式,隨隨便便就能產出超精細質感的大師級繪作。然而「Midjourney AI」服務可不是免費的,每個帳號只有 25 張圖的免費額度,如果把它當娛樂來玩,累積起來也是一筆不少的開支。另一套 AI 繪圖工具「Stable-Diffusion」則是完全的開源且免費,不過提到「開源」則意味著必須自己 DIY 建置起來才能使用,對一般用戶來說依然是有門檻的。後來 Stable-Diffusion 出了一套 Webui 管理工具,讓安裝建置工作的門檻大幅降低,網路上各種教學影片也多到不勝枚舉。
然而 Stable-Diffusion 一開始是建立在 NVidia 的 CUDA 生態圈裡,要使用 Stable-Diffusion 最基本前提是要有一張 NVidia 10+ 系顯卡,並且 VRAM 是越大越好。目前市面上跑 Stable-Diffusion 最佳 CP 的 N 卡為 RTX 3060 12G 礦卡,差不多是全新價的 5 折,台幣六千出頭,再上去就是 RTX 3080 12G/3090 24G 或 4070 Ti 12G 以上等級的顯示卡,隨便一張就是好幾個萬。對於非 N 系顯卡的用戶的支援才剛起步,相關資源和資訊還不夠普遍。作為一個長期黑蘋果的用戶,近年來獨立顯卡始終僅有 A 系可選,想要玩 Stable-Diffusion-Webui 還是有那麼一點點不方便,網路上也比較少見 A 卡運作 Stable-Diffusion-Webu 的相關資源,所以就開一篇文簡單紀錄一下。
- Jul 22 Sun 2018 09:28
【機械學習】教你的 iPhone 認識 Gogoro 換電站(Part 2) - 用黑蘋果電腦玩轉最夯的機械學習
前情提要:教你的 iPhone 認識 Gogoro 換電站(Part 1)- 用黑蘋果電腦玩轉最夯的機械學習。
在前一篇文章中,第一次嘗試從無到有完成整個機械學習影像辨識的練習過程,最終得到一個「必須以半作弊的方式得到貌似可用的訓練模型」這種不太滿意的結果,後續也留下許多問題留待後續探討。接下來這段時間裡,我一直不斷嘗試各種手段,增加辨識成功的機率,不過終究效果有限,誤判的原因也越來越難深究,以至於教學課程訓練好的範例資料可用,自己訓練出來資料卻不能用。才正要開心的向前踏出一步,接著又卡關了,實在很灰心!
於是又再度上谷歌大海中漂流,反覆嘗試搜尋自己可能遺漏了什麼關鍵字,一次又一次的搜尋,一次又一次的觸碰艱深難懂也始終搞不懂的演算法議題。在某一次的資料搜尋中,搜到一張圖片:
- Jun 24 Sun 2018 10:26
【機械學習】教你的 iPhone 認識 Gogoro 換電站(Part 1) - 用黑蘋果電腦玩轉最夯的機械學習(錯誤示範)
近年來所謂的「大數據」(Big Data)、「AI 人工智慧」、「機器學習」(Machine Learning)、「深度學習」(Deep Learning)突然變得很夯,可說是目前最火熱、最具爆炸性發展的當紅顯學。我沒有在豪洨,熱門的程度,可觀察這個現象:在台南的市立圖書館與其他分館中,Python 的書籍根本是一書難求,而且持續很長一段時間。Python 本身除了用途廣泛之外,在機械學習領域更是入門標準,無法規避不學的程式語言,不會 Python 就等於做不成機械學習專家。在多年前我就對這個領域很感興趣,也持續 Google 搜到不少教材,不過坦白講這類學問的技術理論實在是深不見底、高不可攀,找到的教學常常需要參考某某博士論文,或是先弄懂某某數學演算法,這實非我等江湖術士能力所及,所以這條學習之路不論從哪開始下手,沒多久就一定會碰到鐵釘子,走得跌跌撞撞,始終得不到入門的要領。
直到去年(2017 年)蘋果公司於 WWDC 2017 發表了 Core ML 套件,我這條機械學習的黑暗之路終於見到曙光。蘋果宣稱 Core ML 能輕易的將「機械學習模型」(Machine Learning Model)整合到 iOS 裝置的應用程式內,並在 Developer 官網上釋出幾個實用的模型(副檔名為 mimodel)。到了今年 WWDC 2018,蘋果進一步釋出 Create ML 工具,號稱「不需具備機械學習專家技能,也能在 Mac 上輕鬆使用機械學習技術」,並且自動啟用可用的 GPU 加速訓練過程。
當然了,以黑蘋果技術帶入 Mac,這句話也可改寫成:
「不需具備機械學習專家技能,也能在個人電腦上輕鬆使用機械學習技術」
照這篇官方教學(網址),我終於如願完成人生第一個機械學習模型,讓手機也能認識新事物!