給年輕人的有關AIGC的資訊、思考和建議
說明:由於文章較長資訊量較大,因此有關名詞的解釋,以及一些關於AIGC的基礎資訊,就不在文章中詳細闡述,確實不太瞭解的,可以自行透過網路獲取相應的基礎知識。
說明2:本文的目的如標題所述,主要是希望把一些與AIGC有關的相對準確的資訊,以及具備一定參考價值的建議,給到當下的年輕人,避免年輕人被混亂的資料迷惑和被誤導,無法正確地對AIGC進行認知和學習。
一、觀點建議前置彙總
開門見山,將我個人對年輕人的相關建議總結,羅列如下,方便急性子的同學先行了解:
1、 要積極關注新事物新熱點,別神化工具,也別看不起它。必須去了解、嘗試和學習與AIGC有關的各種內容,並不是AIGC有多重要或多先進,而在於不能因為不關注,而與同齡人拉開差距,年輕人,絕對不能放棄對未來的持續瞭解和認知。
2、 要看本質,不要追噱頭。AIGC本質上是一種新潮的數字化工具,不要跟隨某些媒體,主動把相對科幻和玄幻的未來AI功能想象,嫁接到當前的AIGC應用上,來嚇唬自己。
3、 學習過程中,要多探討功能價值,少放飛無用想象。探討AIGC時,不要陷入透過對未來不切實際的假想來決策自身當下行為的怪圈。更多時候,我們應當關注當下的這個新數字工具能做什麼,能實現什麼功能,能提升哪些具體事務的效率,以及會給我們的學習工作生活帶來什麼樣的變化。
4、 數字內容要為實體服務,單純的虛擬數字容易掉入務虛陷阱。AIGC的發展,會幫助我們更快地打通虛實之間的互動屏障,對於近未來我們更深化的日常數字化生活來說,基於虛實的互動必然會越來越普遍,而AIGC的功能特點和優勢,正好可以解決諸多當下虛實互動的難點和問題,因此AIGC有可能會成為未來以虛實互動為主要表現的數字化生活的技術基礎,這也是作為年輕人,更應當主動了解、接觸、嘗試和學習AIGC的主要原因。
5、 少看營銷號,拒絕被忽悠。不要被各式各樣的媒體自媒體灌輸奇怪的AI理論,更不要被它們刻意營造的恐慌所誤導,要清晰清楚地認識世界的執行邏輯,以及人類的思考邏輯,人類的分散決策機制與AI的二分理論,並不是一個維度上可以用於直觀比較的東西,要避免自身的思維被AI的執行邏輯扁平化。
6、 主動關注數字工具的迭代發展,不要停留在舊認知上。在我們的生活越來越數字化的當下,我們不可避免地會用數字化的方式,以及數字化的邏輯來進行判斷,這樣做的主要原因,是透過這種方式和邏輯,能夠更好地簡化我們的思考,縮短我們的決策時間,提升決策效率,但這並不代表數字化的方式和邏輯,能夠真正改變我們。
7、 適當的時候,需要從更高的視角去看問題。一定要跳出那些常見的認知誤區,不要被段子,以及相對玄幻的假想描繪的“未來可能性”給誤導了,科技的進步從來都不是一蹴而就的,AIGC也不是萬能靈藥,可以解決一切問題,要審慎且客觀地去了解和分析,再得出符合自身需求的結論。
二、以Midjourney為代表的AIGC能做什麼
AIGC近幾年被廣泛關注,肯定離不開以Midjourney為代表的圖片生成工具在社交媒體上的廣泛傳播,以及ChatGPT的火爆出圈,本文也將以這兩個具備較強代表性的應用來展開。
相信大家在各種社交媒體,特別是在微信群裡,見到過被多次轉發,多次水印和反覆降低圖片品質後,圖片都包漿了的梗圖。
對於透過關鍵詞描述來生成相應圖片的AIGC來說,圖片生成的過程,其實就類似上述這個不斷加噪的包漿梗圖的逆向化過程,也就是在圖片素材庫的幫助下,對關鍵詞描述下的內容,進行不斷的降噪,最終批次生成符合關鍵詞描述,且具備符合訓練相簿顯著特點的內容。
這也是相應的AIGC需要構建龐大的訓練素材庫,以及需要較強GPU算力的主要原因;同時也是對AI調教以後,能夠提升出圖品質的關鍵原因;並且這也是對美術具備更強認知能力和鑑賞能力的AIGC使用者,能夠透過關鍵詞描述,獲得更具價值的圖片的重要原因。
因為對同一個工具的使用,不同專業契合度的使用者,必然會有不同的產出效率和產出品質。
瞭解了AIGC的工作原理以及工具特點以後,我們就會發現,以MJ為代表的圖片生成AIGC,有著特別鮮明的工具性特點,並且是一個很新穎的、相對高效的、需要一定專業基礎的工具。
對於這樣的工具來說,工具本身的迭代發展和進化,以及工具是否具備普遍使用性,工具是否具備替代其他工具的價值,就會成為其關鍵點。
以MJ為例,從2022年3月推出Beta邀請,到2023年3月推出大革新的MJ-V5,其發展和迭代速度是非常可怕的,去年暑假期間,MJ的使用者還在糾結於出圖的臉部不夠真實、肢體形態彆扭、手指腳指各種BUG,但到了今年,骨骼的使用和手指最佳化,是讓很多老使用者有驚豔到的。
基於這樣的迭代發展速度,我們可以大膽的預測,以MJ為代表“以文生圖”類AIGC,應當會在一個較短的時間內(6-18個月),進入到普遍商業化階段,被應用在諸多領域,其商業價值及未來發展是可期的。
因此,對於年輕人來說,沒有必要去懷疑此類AIGC的價值和前景,更應當關注的,是MJ類的AIGC,可以被應用在哪些領域,可以用來降低哪些工作的門檻,可以給使用者帶來哪些領域的便利,甚至可以造就什麼樣的新崗位。
此處,我更希望大家去結合自身的專業方向和知識體系,來進行構想和探討,進而得出屬於自身的準確結論,因為每個人的知識結構都是有其侷限性的,不同人看到的應用方向必然會有差異。
關鍵點在於,這些可能的發展方向和給相關產業所帶來的影響、變革和衝擊,能夠讓你接下來的學習和工作,產業什麼樣的變化,收穫什麼樣的新思路。
我自身有相對比較長時間的遊戲產業工作經驗,因此在我看來,以MJ為代表的AIGC一旦進入普遍商業化階段,那麼就可以幫助美術實力不夠強勁,人力成本相對侷促的中小團隊,以更為高效和專業的方式,確定產品的美術風格,甚至直接幫助團隊獲得所需的美術資源。
而對於體量較大的遊戲公司來說,AIGC特色庫的低成本構建,也可以有效提升專案早期的試錯成本和試錯週期,這些幫助都是直觀可見的。
三、Chat GPT的關鍵點和發展方向
相較MJ已經處於商業化前期,Chat GPT顯然還處於各種維度下的探索階段,離普遍商業化還有一段距離。
在聊GPT之前,我們必須先釐清一個GPT使用的AI領域的關鍵性概念 “Human in the LOOP”(人在迴路),簡單來說,就是在對AI進行訓練的過程中,透過在關鍵訓練節點處,加入人工選擇調優因素的方式,來加速AI的學習和成長。
舉一個不是特別合適的例子,類似流浪地球2裡,MOSS先後“吃掉”了圖丫丫和圖恆宇,從而透過“人在迴路”的方式,快速獲得了成長。只不過在現實當中,人在迴路的方式,對於AI的訓練成長所起到的作用,雖然也很直觀,但卻不如科幻電影來得迅速和鮮明。
需要特別說明的是,人在迴路這個方向,之前並不被AI領域的科研人員廣泛接受,或者換個說法,透過人在迴路的方式來對AI進行訓練,在AI的研究領域,是存在一定爭議的。
當然,對於普通使用者而言,以及對於年輕的關注者來說,這些並不需要太過去關注,我們還是把關注點放到GPT所處的階段以及能解決的問題上來。
對比有明確落地場景的MJ來說,GPT最核心的問題,並不是它所出具的資訊是否可信,也不是它所給出的內容能夠給使用者帶來什麼樣的實質幫助,更不是它能不能透過某某考試,又或者它能不能“聽懂”人類才能聽懂的笑話,這些問題本質上都是細枝末節。
GPT當下面臨的最核心問題,其實是GPT是基於計算機數字二元論邏輯規則下的線性產物,而人類思考問題則是網狀神經規則下的多維邏輯。
嗯,這句話聽不明白不重要,可以簡單理解為,GPT的關鍵執行機制和所輸出內容,並不符合人類社會生活的廣泛需求。
舉一個簡單的例子,不少媒體自媒體都會告訴你,GPT可以用來寫讓導師都認可的優質論文,美國很多中學和高校要求學生不能使用GPT。
我們不去探討這些資訊的真實性、縫合性和複雜性,單純只從需求本身來看,對於看論文的導師來說,收到一份論文,不管有沒有使用GPT來生成,導師最容易出現的反饋是什麼?
是“哇,寫得真好,給你一個優!”
還是“看完了,寫得不錯,但在這些點上,你需要最佳化調整一下,改一改再重新提交過來。”
對於GPT來說,根據溝通獲取使用者需求,後臺透過一整套機制來給出“使用者最有可能想要的內容”,就是工作的一切了,這是符合數字二元論邏輯的,但對於人類使用者而言,透過GPT得到自身想要的內容,必然只是開始。
因此GPT當下的問題是,雖然透過人在迴路的方式,以及本身的人工智慧應答方案,讓使用者獲得了相對驚豔的互動體驗,但卻無法從人類的角度,幫使用者解決真正的問題,更多時候GPT所扮演的角色,是讓使用者獲得了一個更新更好的,不但能夠幫助解決問題,甚至還能夠幫助使用者簡化問題和明確問題的新型人機互動入口。
這有點類似搜尋引擎從最早Yahoo!的樹狀細分方式,進化到Google的關鍵詞搜尋機制。這其實也是微軟將GPT嵌入到Bing當中,同時也推出與Office辦公元件結合服務的原因。
簡單來說,使用者透過GPT這個入口,可以更精準更省力地獲取相應資訊,以及梳理相應資源,而這一點在當下移動網際網路海量資訊,透過傳統搜尋引擎需要付出較高時間成本才能獲得有效資訊的環境下,是具備解決方案層面的領先優勢的。
但這也是當前GPT還不具備普遍商業化價值的關鍵所在。
因為當我們思考GPT的商業落地方案時,就不象MJ那樣有許多可以提升效率,甚至改變某些領域環境業態的暢想。
畢竟從根本上來說,GPT這個入口,還沒有真正意義上被明確和固定下來,甚至這個入口的形態,以及這個互動入口的互動機制和互動優勢,也沒有被完全挖掘出來,未來或許有著更多的可能性,但至少眼下,以GPT-4為標準來看的話,還需要繼續迭代發展,直到這個入口被明確下來,並承擔更多的職能,滿足使用者更多的複雜訴求。
四、其它型別的AIGC有哪些價值
當然,除了MJ和GPT,還有不少其它型別的AIGC應用和工具,例如Notion AI、Tome、Fliki等AIGC工具。
這些AIGC工具往往會在某個細分領域,或某個具體的場景,提供更優的解決方案或功能體驗,考慮到這塊的實際探討空間會相對明確,同時專業度也更細化一些,因此就不再做展開式的探討,只是簡單地把一些個人的看法和建議同步給大家。
簡而言之,大多數此類的AIGC,往往會專注於“用更省時省力的方式解決某個具體的日常需求”,或“提供給使用者新的具備顛覆性感受的特定場景下的使用感受”。
因此,以當下AIGC特別快速的成長和發展來看,在未來的6-18個月裡,應當會有至少2-3款此類AIGC,進入到廣泛使用者關注的視野中,進而推高使用者群體對AIGC的整體期望。
同時對於年輕人來說,如果有明確的關注方向,以及有更為清晰的自身定位,那麼多某個特定領域來關注AIGC的整體發展,或許是一條提升自身能力和搶佔優勢發展機遇的捷徑,值得關注和嘗試。
此處我不負責任地隨便舉幾個可能的例子。
例如透過關鍵性圖文和模板,生成短影片和動畫的AIGC;透過真實圖片批次生成二次元圖片和影片的AIGC;以及反過來,透過動漫圖片和描述,生成具備真實度的真人圖片和影片等等。
總的來說,這會是一個相對具備活力,且有諸多可能性的AIGC領域,值得年輕人投入更多的時間、精力和關注度。
五、AI高速發展下的虛實互動有著無限可能
在透過兩個典型應用,大致聊完了有關AIGC的相應資訊以後,對於年輕人來說,其實是需要進行更深層次思考的。
雖然本輪AI發展和探討浪潮,與前幾次AI發展浪潮,存在一定的相似性,但時代發展快速向前,主要使用者群體的變化、差異性和訴求變更,也讓本輪AI的高速發展,有更多值得所有使用者特別注意的點。
從社會整體發展來看,我們當下的社會,特別是國內當下的社會,都很現實地面臨一輪新的數字化程式,這一輪數字化程式與25年前開啟的國內網際網路大潮一樣,數字化程度的加劇,以及社會更多環節的數字化革新,必然會讓我們的社會進入到一個全新的數字化階段。
而這個全新的數字化階段,已然無法用傳統“網際網路”來進行描述和說明,這也是在最近兩年,我們會更關注“元宇宙”這個詞的原因,並不是這個還沒有得到廣泛認可且缺乏標準解釋的“元宇宙”能夠代表未來,而是我們需要一個新的名詞,來描述和說明我們正在構建的,數字化程度更加深入的未來社會,而“元宇宙”這個詞,有著特別優秀的包容性,看著就特別合適。
需要特別說明的是,歐美的Metaverse概念,一直是相對務虛的,也就是強調虛擬數字空間,以及虛擬數字空間給生活帶來的變化,不管是Meta,還是Epic,又或者Roblox,它們所描繪的Metaverse都是強調虛擬數字空間,以及在虛擬數字空間中的各種可能性。
但國內經過兩年多的探討,“元宇宙”這個概念,已經不再侷限於虛擬數字環境了,而是更為強調虛實互動,虛擬數字世界與現實世界,如何透過元宇宙的概念和技術,產生相互的交融和發展,進而以虛促實以實構虛,形成真正意義上虛實互動虛實交融的“國產”元宇宙展望。
而當我們用當前社會數字化程式加深的視角來看這輪AIGC的發展時,我們就會更清晰地看到,AIGC所具備的特性、生命力和關鍵價值。
舉兩個比較直觀的例子。
例如最近幾年備受社會群體關注的“數字人”技術,當我們透過各種技術手段,構建了一個某某銀行數字人以後,如何讓這個數字人創造更大的價值,更好地服務銀行使用者呢?
在AIGC被關注到之前,我們能夠使用的,大概就只有應答指令碼這種所謂的“智慧客服”,而一旦我們用一個相對成熟的銀行專業領域固定訓練庫的GPT來作為數字人的中樞,那數字人的實際應用價值可能就會以指數級的方式獲得提升。
相類似的,一個放置在博物館、科技館或天文館的接待機器人,如果將一個具備相應領域專業度的AIGC置入其中,來作為機器人的人機互動核心,那其知識的專業度、標準性以及個性化應對,就會有各種超出常人想象的可能性。
因為這類AIGC的互動,將不再是固定的互動規則主導,而會演變為使用者需求主導。同樣場館的互動機器人,對不同使用者,會因為使用者的不同喜好,而有著完全不同的互動體驗和資訊輸出。
因此在我看來,本輪AIGC的高速發展浪潮,真正能夠讓普通社會群體感受到變化的,有可能是社會數字化程式加劇的大趨勢下,虛擬數字與現實社會的虛實互動場景。
比較有落地場景假想的,包括醫療領域、教育領域、金融領域、社科領域及特定群體服務領域等,考慮到篇幅問題,在這就不做展開了。
六、奇點理論和智慧財產權
前瞻完AIGC發展的未來可能性以後,我們來探討幾個相對爭議較多的話題。
首先是奇點理論。
在人工智慧這個方向,關於人工智慧奇點的話題一直是廣受專業人士和普通人群所關注的。
本輪AIGC浪潮下,也有各式各樣關於奇點理論的猜想和假設,有關人工智慧的奇點再次即將到來的聲音,音量也一直比較大。而預設奇點很快到來這個前提下,所衍生出來的諸如某某崗位即將消失,某某領域即將被顛覆的焦慮提升討論也是層出不窮。
在這我不打算做深入的探討,或者說我不想陷入到無休止也無意義的爭論當中,我只想簡單地闡述我個人的觀點,如下:
本輪AIGC的發展,其工具特性要遠超技術特性,不論是MJ這類以文出圖的工具,還是採用人在迴路模式的“有著無限可能的”Chat GPT都是如此,人們應當把關注點放在這些AIGC能夠給我們的學習、工作和生活帶來哪些便利,而不應當去猜想AIGC的發展會帶來哪些科幻的可能性,因為不管是有著明確工具特點的MJ,還是看上去很有機會的GPT,都不太可能觸達到人工智慧的奇點。
舉個困擾汽車自動駕駛倫理設計的例子來佐證我的觀點。
在自動駕駛這個細分方向,影響其普及和推廣的核心問題,並不是技術本身,而是社會倫理問題,我們這樣假定,有一條專用的公路,只允許自動駕駛的無人貨車進入,那麼很顯然,所有可能發生的問題,都非常容易被解決,這裡可以參考一些自動化程度極高的大型港口裝卸基地的現狀。
真正讓當前汽車自動駕駛應用無法獲得推廣,始終處於完善和龜速推進的關鍵原因,其實是採用自動駕駛後所面臨的社會倫理風險。當你的汽車判斷前方因外部客觀因素,必然會發生撞擊時,你的自動駕駛系統究竟應當先保障乘客的安全,還是儘量避免撞擊過程可能會導致的第三方安全風險呢?如何透過AI機制去平衡這個兩個選擇都很糟糕,但卻必須選擇一個的狀態?
其次是AIGC產出內容的智慧財產權問題。
這與上一個例子有類似之處,因為智慧財產權的衍生內容,是人才會關注的,對於AI和AIGC來說,產出的內容是否具備智慧財產權,以及是否侵犯了他人的智慧財產權,是無所謂的事情。
但它所衍生出來的問題卻是很難規避的。
一方面是AIGC的學習過程,是否存在侵權的嫌疑,例如我們使用了某位有著鮮明藝術風格的藝術家的作品來訓練AIGC,使得這個AIGC所產出的內容,都有著藝術家的藝術風格特性,那這是否構成侵權?
再例如已經有實際案例的,一些心術不正的使用者,用知名網路人物或明星來訓練AIGC,產生有明星人物鮮明形象特點的色情圖片,用以牟利。以及包括上週受全閘道器注的,美國網民透過AIGC來生成美國前總統川普被抓捕的圖片等等,這些都會涉及到侵權問題,以及一定意義上的法律邊界問題。
另一方面則是透過AIGC所產出的內容,是否應當具備智慧財產權的屬性,需要被智慧財產權所保護?這方面歐美已經有了一些實際的訴訟判例,但同樣的情況下,是否有探討的空間,以及在實際的爭議過程當中,要用什麼樣的方式來解決,很顯然,還是有很多的相關問題,需要更為深入的討論,才能獲得更廣泛群體認同的。
當然除了奇點理論和智慧財產權等話題,AIGC其實還有更多的其它衍生的話題討論,例如翻譯工具、輔助工具、大小庫、倫理風險、資訊保安等等,在這就不做展開了。
需要特別說明的是,對於年輕群體來說,如果你對AIGC已經有了一些嘗試和了解以後,這些衍生話題對自身的幫助,或許會比對AIGC本身的學習研究來得更大一些。
因為年輕群體最需要的,不僅僅是技能和知識層面的提升,還有來自思維模式、探討角度和視野高度的綜合性提升,而這些衍生話題,往往會給個體帶來這些層面的變化和思考。
七、AIGC的未來價值展望
然後我們來簡要探討一下關於AIGC的未來價值展望。
在我看來,AIGC的工具性,是下一個階段發展的重要方向,也是很快會被相關領域所接受和使用的主要原因。
因為AIGC的輔助性特點以及個性化差異,會讓很多產業和領域的難點痛點,獲得一個全新的解決問題的思路擴充,在引入AIGC的前提下,許多行業的流程規範可能會被重構,一些崗位也可能會面臨真正意義上的顛覆性變化。
舉一個很接地氣的例子。
全國三四線城市的一些小的列印設計店,日常是需要一兩位設計師來承接一些難度不高,但又有一定門檻的圖形設計工作,而當AIGC獲得了充分發展後,這些設計崗位可能就會消失,因為AIGC按規則出具的設計內容,已經完全可以滿足這些門店絕大多數日常需求了。
再例如旅遊地的資訊介紹和瀏覽引導工作,在AIGC充分發展和引入後,可能就會給旅遊點的遊客體驗,帶來顛覆性的最佳化和改變,甚至有可能對旅遊過程進行體驗層面的重構。
而這些,只是我們根據當下AIGC的發展,可以想象和預見到的未來展望。而AIGC的快速成長態勢,顯然會帶來更多的可能性,並且帶來更多的顛覆性,用一句已經被濫用的話來說,隨著AIGC的高速發展,“未來已來”。
文章看到這裡,歡迎大家回到文章的開頭,再看一下被放在文章最前面的觀點建議彙總,也希望這些內容能夠給各位年輕人帶來一些有價值的幫助,感謝。
原文:https://zhuanlan.zhihu.com/p/617684725
相關文章
- 關於程式碼版本管理的思考和建議
- 有關雲架構建設和選型的思考架構
- 給PHP開發者的建議PHP
- 2020年,馮唐49歲:我給20、30歲IT職場年輕人的建議
- 圖靈社群改版的一些建議和思考圖靈
- 有沒有人在學習webwork,給點好的建議Web
- 給IT新人的15點建議
- 關於《給部落格園的幾點現實建議》
- 有關GO和Erlang的一些思考Go
- 給大資料入行者的,建議和書單大資料
- 有關軟體的思考
- 給新手學習MySQL的建議MySql
- 資訊的傳遞與連結:有關《死亡擱淺》的思考
- 企業的公共關係技巧和建議
- 給遊戲關卡設計的建議,如何用好引擎工具遊戲
- 資訊化建設思考
- 關於-生物資訊-入門-的思考
- 大魚思考---有關190億$的思考
- 給機器學習面試者的十項建議機器學習面試
- 給初學java的一點建議Java
- 給 itpub 提建議
- Linux中查詢賬號資訊的命令有哪些?建議收藏!Linux
- 關於CCNA和學習方法的一點建議
- 給DBA的SQL Server培訓建議PHSQLServer
- 一個牛人給Java初學者的建議Java
- 給iOS開發者的Android開發建議iOSAndroid
- 寫給Git初學者的7個建議Git
- 給獨立遊戲製作人的進階建議遊戲
- 設計HBase資料庫資料表有關的建議資料庫
- 有關專案的幾點思考
- 有關記憶體的思考題記憶體
- win10如何關閉建議_win10關閉建議的方法Win10
- 給2019前端的5個建議前端
- 給服務端小白的一些建議服務端
- Linux入門(2)_給初學者的建議Linux
- 我給所有新手程式設計師的建議程式設計師
- 給未來精英程式設計師的建議程式設計師
- 雷軍給程式設計師的五點建議程式設計師