人工智能專家對過去幾年的進步感到興奮。 你可以告訴! 他們一直在告訴記者諸如“ 一切都在開花 ”、“ 數(shù)十億人的生命將受到影響 ”和“當我與一個人交談時我就認識一個人——不管他們是否有一個由 肉 頭 。”
不過,我們不必相信他們的話。 最近,人工智能驅(qū)動的工具已經(jīng)直接為公眾所知,在我們的社交信息流中充斥著奇異而令人震驚且通常非常有趣的機器生成內(nèi)容。 OpenAI 的 GPT-3 采用簡單的文本提示——寫一篇關(guān)于人工智能的新聞文章或想象 學士 ——并產(chǎn)生了令人信服的結(jié)果。
Deepfakes 從一個迫在眉睫的威脅中畢業(yè),一個有進取心的青少年可以為 TikTok 組合起來,聊天機器人 偶爾 會讓他們的創(chuàng)造者陷入危機。
更廣泛,并且可能最能喚起創(chuàng)造性人工智能 的 是新的圖像創(chuàng)建工具,包括 DALL-E、Imagen、Craiyon 和 Midjourney,它們都做同樣事情的版本。 你要求他們渲染一些東西。 然后,用從網(wǎng)絡(luò)和其他地方收集的大量圖像訓練模型,他們嘗試——“蘇聯(lián)雕像風格的巴特辛普森”; “切爾西街道上的金杜德巨型動物”; “地獄的意大利面晚餐”; “地毯清潔公司的標志,藍色和紅色,圓形”; “生命的意義?!?
通過一百萬個帖子和模因,這些工具已成為 AI 的新面孔。
機器生成的媒體泛濫已經(jīng)改變了 話語 ,可能會變得更好,盡管情況不會更糟。 與 VC 內(nèi)部關(guān)于避免未來超級智能奴役人類奴役的油嘴滑舌的辯論相比,關(guān)于圖像生成技術(shù)的討論由用戶和藝術(shù)家推動, 重點關(guān)注勞動力 、知識產(chǎn)權(quán)、人工智能偏見以及 藝術(shù)借用和復制的倫理 . 早期的爭議已經(jīng)切入正題:在科羅拉多州的美術(shù)比賽中進入生成藝術(shù)( 并獲勝 ?。┑娜耸腔斓皢?? 從游戲、電影和電視領(lǐng)域的概念藝術(shù)家到自由標志設(shè)計師,在他們的行業(yè)中已經(jīng)感到被低估或被剝削的藝術(shù)家和設(shè)計師對自動化感到擔憂是可以理解的。 一些藝術(shù)社區(qū)和市場已經(jīng) 禁止 人工智能生成的圖像。
我花時間使用這些工具的當前版本,它們非常有趣。 他們也會讓你失去平衡。 能夠生成看起來像照片、繪畫、素描或 3-D 模型的圖像并不能使某人成為藝術(shù)家或擅長繪畫,但它確實使他們能夠在物質(zhì)方面創(chuàng)造 藝術(shù)家 近似 一些 的 立即以低廉的價格生產(chǎn)。 知道你可以在特定時刻表現(xiàn)出你在想的任何東西,這也意味著一種奇怪的、定制的數(shù)字通信模式,即使是私人對話和轉(zhuǎn)瞬即逝的想法也可以被解釋和說明。 當您可以要求機器展示事物時,為什么只向人們描述事物?
盡管如此,大多數(shù)關(guān)于人工智能媒體的討論都讓人覺得是投機性的。 谷歌的 Imagen 和 Parti 仍在測試中,而像 Craiyon 這樣的應用程序很有趣,但技術(shù)演示卻降級了。 OpenAI 正在開始將 DALL-E 2 轉(zhuǎn)變?yōu)橹髁鞣盏倪^程,最近 邀請 了 100 萬用戶,而強大的開源模型 Stable Diffusion 的發(fā)布意味著 更多的工具 即將到來。
然后是 Midjourney,這是一款已向大眾開放數(shù)月的商業(yè)產(chǎn)品,用戶一直在通過它來面對和回答一些關(guān)于人工智能媒體生成的更實際的問題。 具體來說:如果有機會提出問題,人們實際上想要從中得到什么?
Midjourney 在某些方面與同行不同。 它不屬于或附屬于大型科技公司或更廣泛的人工智能項目。 它沒有籌集風險投資,只有十名員工。 用戶可以每月支付 10 美元到每年 600 美元不等,以生成更多圖像、訪問新功能或獲得許可權(quán),成千上萬的人已經(jīng)擁有。
它基本上也只是一個聊天室——事實上,在它公開發(fā)布后的幾個月內(nèi),它是 Discord 中最大的一個,擁有近 200 萬會員。 (就規(guī)模而言,這是 Fortnite 和 Minecraft 。)用戶通過提示機器人來召喚圖像,該機器人試圖在一系列公共房間(#newbies,#show-and-tell)中滿足他們的請求,#daily-theme 等),或者,對于付費訂閱者,在私人直接消息中。 根據(jù)創(chuàng)始人大衛(wèi)霍爾茲的說法,這個機器人將請求傳遞給 Midjourney 的軟件——“人工智能”——該軟件依賴于從一家未公開的主要云提供商租用的服務器。 Holz 說,請求實際上被扔進了“10,000 個顯卡”的“巨大漩渦”中,之后用戶逐漸看到它們成形,變得清晰,但隨著 Midjourney 改進其工作而改變形式。
這暗示了藝術(shù)和設(shè)計領(lǐng)域之外的外部性。 “幾乎所有的錢都花在了購買這些機器上,”Holz 說。 新用戶在被切斷并被要求付費之前會獲得少量的免費圖像生成; 每個請求都會啟動一項龐大的計算任務,這意味著要消耗大量電力。
高昂的計算成本——主要是能源成本——是其他服務對增加新用戶持謹慎態(tài)度的原因。 Midjourney 選擇將這筆費用轉(zhuǎn)嫁給用戶。 “如果目標是廣泛使用,那么云需要大一千倍,”Holz 說。
暫時不考慮人工智能笑話、圖像引發(fā)的能源和氣候危機的前景,Midjourney 的 Discord 是一個有趣的潛伏場所。 用戶工程師用破碎的然后流利的Midjourney-ese進行提示,從簡單到難以理解; 互相聊聊人工智能藝術(shù); 并征求意見或批評。 在加密貨幣崩潰之前,我看到用戶制作了低預算的 NFT 收藏品,并帶有“宮崎駿風格的鋼鐵俠,交易卡”之類的提示。 尤其是在早期,有人口統(tǒng)計信息。 有很多關(guān)于 Walter White 的半生不熟的笑話提示,以不協(xié)調(diào)的藝術(shù)風格呈現(xiàn)的視頻游戲角色,而且,盡管 Midjourney 的 1,000 多個禁用詞列表和活躍的版主團隊,大量有點到非常角質(zhì)的嘗試召喚看起來像粉絲相鄰名人的幻想女性。 現(xiàn)在,一次有幾十萬人登錄,這是巨大而令人迷惑的。
Midjourney Discord 的公共部分最類似于工業(yè)規(guī)模的自動化 DeviantArt,觀察者 認為 它從中學到了一些常見的數(shù)字藝術(shù)敏感性。 (DeviantArt 充斥 著 Midjourney 藝術(shù),它的一些用戶并不滿意。)Holz 說,由于沒有更具體的說明,Midjourney 已經(jīng)確定了一些默認樣式,他將其描述為“富有想象力、超現(xiàn)實、崇高和異想天開”。 (相比之下,可以說 DALL-E 2 偏愛照片寫實。)更具體地說,他說,“它喜歡使用藍綠色和橙色。” 雖然 Midjourney 可以被提示以數(shù)十位在世和死去的藝術(shù)家的風格創(chuàng)作圖像,其中一些人公開反對這一前景,但 Holz 表示,它并沒有刻意針對其中任何人進行訓練,有些人很高興發(fā)現(xiàn)自己在模型中。 “如果有的話,我們傾向于讓藝術(shù)家 要求 更好地復制它們?!?
但是,很多時候,您會遇到有人逐漸苦心地完善特定提示,真正 在 做某事,并且因為您在 Discord 中,您可以問他們在做什么。 用戶 Pluckywood,真名 Brian Pluckebaum,從事汽車半導體營銷工作,同時設(shè)計棋盤游戲。 “從棋盤游戲的設(shè)計到發(fā)布棋盤游戲的最大差距之一就是藝術(shù),”他說。 “以前,你只能通過出版商工作,因為個人無法雇傭所有這些藝術(shù)家?!?為了生成他正在開發(fā)的新游戲所需的“600 到 1,000 個”獨特的藝術(shù)作品——“盒子藝術(shù)、角色藝術(shù)、規(guī)則書藝術(shù)、站立藝術(shù)、卡片藝術(shù)、卡片背面、棋盤藝術(shù)、傳說書藝術(shù)”——他向 Midjourney 發(fā)送這樣的提示:
角色設(shè)計,迷人而美麗的女性吸血鬼,她的手是爪子,她在舔一只爪子,哥特式,電影,史詩般的場景,體積照明,極其細致,錯綜復雜的細節(jié),Jim Lee 的繪畫,低角度拍攝 –testp
Midjourney 以一種既匿名又有點可識別的風格將她送回,足以讓她長時間看一眼,但在大多數(shù)生成圖像工具中仍然很常見,雙手令人困惑。 “我不會用白文本空白游戲來接近出版商,”Pluckebaum 說。 如果他們有興趣,他們可以聘請藝術(shù)家來完成工作或收拾東西; 如果不是,那么,現(xiàn)在他可以自行出版了。
Midjourney 的另一位用戶 Gila von Meissner 是來自“德國北部的貧民窟”的平面設(shè)計師和兒童讀物作者兼插畫家。 她的經(jīng)紀人目前正在購買一本將生成的圖像與她自己的藝術(shù)和角色相結(jié)合的書。 像 Pluckebaum 一樣,她提出了與出版商的權(quán)力平衡。 “圖畫書付出了花生,”她說。 “大多數(shù)插畫師都在財務上苦苦掙扎?!?為什么不讓工作更輕松、更快捷? “這是我的角色、我對 AI 背景的編輯、我的聲音和我的故事?!?她說,一個需要幾個月的過程現(xiàn)在需要一個星期。 “這是否會降低它的原創(chuàng)性?”
用戶 MoeHong 是加利福尼亞州的一名平面設(shè)計師和印刷師,他一直在使用 Midjourney 為政府網(wǎng)站、小冊子和文學作品制作他所謂的通用插圖(“背景、工作中的人、學校里的孩子等”): “我得到了使用定制藝術(shù)品的一些好處——而不是我們有傭金預算! ——沒有付費藝術(shù)家的部分?!?他說他已經(jīng)大部分更換了股票藝術(shù),但他對這種情況并不完全滿意。 “我有很多朋友是商業(yè)插畫師,我一直非常小心地不向他們展示我的作品,”他說。 他堅信,像這樣的工具最終可能會讓從事他行業(yè)的人失業(yè)。 “但我已經(jīng) 50 多歲了,”他說,“我希望到那時我會離開?!?
這種預測的變化在委員會的不同方面很常見。 例如,澳大利亞一家廣告公司的一位高管告訴我,他的公司正在“將人工智能藝術(shù)作為一種解決方案來提供更廣泛的創(chuàng)意選擇,而無需在營銷活動中投入大量預算,尤其是對我們的全球客戶而言。” 這位高管說,最初,人工智能圖像讓客戶處于“后腳”,但他們已經(jīng)好轉(zhuǎn)了。 客戶越來越難以將 Midjourney 圖像與人工創(chuàng)作的藝術(shù)區(qū)分開來——然后就是價格。 “能夠一次又一次地創(chuàng)造無限、逼真的圖像已成為一個關(guān)鍵賣點,尤其是在傳統(tǒng)制作會產(chǎn)生巨大成本的情況下,”這位高管說。
Bruno Da Silva 是 R/GA 的藝術(shù)家和設(shè)計總監(jiān),R/GA 是一家在全球擁有數(shù)千名員工的營銷和設(shè)計機構(gòu)。 他最初對 Midjourney 感興趣是因為他自己的業(yè)余項目,并很快在工作中找到了用途:“我收到邀請后的第一件事就是在 R/GA 周圍展示 [Midjourney 藝術(shù)],我的老板說,‘這他媽的是什么那?'”
它很快加入了他的工作流程。 “對我來說,當我要推銷一個想法時,重要的是要推銷整個東西——視覺、字體、顏色。 客戶需要看看我腦子里在想什么。 如果這意味著聘請攝影師或插畫師在幾天或一周內(nèi)制作出真正特別的東西,那將是不可能的,”他說。 他向我展示了他在推銷期間與大公司客戶分享的概念藝術(shù) - 一家床墊公司、一家金融公司、一家規(guī)模太大而無法描述而無法識別的科技公司的分支機構(gòu)——這些概念藝術(shù)部分受到了 Midjourney 的啟發(fā)或創(chuàng)作。
達席爾瓦說,圖像生成器在項目的早期階段特別有效地改變松散的想法,當時許多設(shè)計師在谷歌圖片、Shutterstock、Getty Images 或 Pinterest 或彼此的作品中尋找參考和靈感。
這些膚淺的共享引用導致了“一切看起來都一樣”的情況,達席爾瓦說。 “在設(shè)計史上,人們曾經(jīng)非常努力地創(chuàng)造出新穎獨特的東西,而我們正在失去這一點?!?這可能是對藝術(shù)生成器的雙重批評,它們接受過一些相同的資源和設(shè)計工作的培訓,但達席爾瓦不這么看。 “我們已經(jīng)像計算機一樣工作了——非???。 這是相同的過程,相同的簡短,相同的截止日期,”他說。 “現(xiàn)在我們正在使用另一臺計算機離開那個地方。
“我認為我們的行業(yè)將在未來三年內(nèi)發(fā)生很大變化,”他說。
自 6 月以來,我一直在使用 Midjourney 并為其付費。 根據(jù) Holz 的說法,我符合最常見的用戶特征:為自己、家人或朋友做實驗、測試極限和制作東西的人。 我在幾個小時內(nèi)耗盡了我的自由世代,將圖像發(fā)送到群聊和工作 Slack 和電子郵件線程中。
我生成的絕大多數(shù)圖像都是笑話——大多數(shù)是給朋友的,還有一些是我和機器人之間的。 有一段時間,通過向超級計算機詢問一個被粘在膠床上的人的可怕渲染圖來打斷關(guān)于購買哪種捕鼠器的聊天,或者用“麥克曼森金字塔”的渲染響應共享的 Zillow 鏈接,這很有趣吉薩?!?當一位一直在試驗 DALL-E 2 的朋友將該工具描述為一個處理侵入性想法的地方時,我點點頭,在我的 Midjourney 窗口中滾動回到一個非常令人信服的觀點“喬·拜登在海灘上曬黑,由 R.屑?!?
我仍然以這種方式使用 Midjourney,但新穎性已經(jīng)消失,這在很大程度上是因為效果圖變得 更好 —— 奇怪和美麗 ”,不如說“有能力和合理”。 這一點也變得陳舊,我已經(jīng)繪制了我藝術(shù)想象力的狹窄界限。 許多已經(jīng)風靡一時的人工智能藝術(shù)都是從產(chǎn)生恰到好處的結(jié)果的提示中產(chǎn)生的:接近到足以令人吃驚但仍然以某種方式偏離,通過一個誤解的詞,一個使圖像變得令人毛骨悚然的奇怪人工制品,或者一個完全亂線概念插值。 令人驚訝的錯誤是人工智能圖像對真正創(chuàng)造力的最佳近似,或者至少是最令人愉悅的。 TikTok 上個月發(fā)布的原始圖像生成器 包含了這一點 。
當人工智能藝術(shù)有點失敗時,就像它在這個早期階段一貫的那樣,這很有趣。 當它簡單地成功時,正如它將在未來的幾個月和幾年中越來越令人信服一樣,它只是,嗯,自動化。 人們可以通過手機以低廉的價格通過有爭議的過程以低廉的價格命令存在的東西越來越多:瑣事、餐飲、汽車、勞動力。 新的人工智能公司問, 為什么不是藝術(shù)?