
陳龍:ChatGPT兩周年,美國科技公司“AI 七姐妹”: 領跑者的七個啟示(第一篇)
時間:24-12-02 來源:為溪進化派
陳龍:ChatGPT兩周年,美國科技公司“AI 七姐妹”:
領跑者的七個啟示(第一篇)
引言
自2022年11月ChatGPT聊天機器人推出以來,短短兩個月內用戶規模就突破了一億大關,創下了消費級應用用戶增長速度的新紀錄。這標志著人類邁入了人工智能革命的新紀元。
如今,兩年的時間已經過去。
越來越多的人開始認識到,這場革命可能是一個千載難逢的機遇,其影響力堪比電力革命,對經濟和商業都將產生深遠的影響。最近,我與羅漢堂學術委員會成員、復雜經濟學奠基人、《技術的本質》(這是關于科技最經典的書籍之一)的作者Brian Arthur教授進行了深入交流。他相信,這場AI革命的潛力或可與14世紀印刷術對人類社會的影響相媲美:“如果我們在2100年回顧21世紀,可能會認為,70多年前發生的最重要的事件不是地緣政治或戰爭,而是AI技術的突破”。
技術要融入經濟體系,商業應用是其載體。因此,在技術領先于應用的時期,正是商業領域最充滿激情的階段。那么,如果有一個可比電力革命的機會,我們應該如何帶著對電力革命的理解,去擁抱這次機會?
像往次科技革命一樣,人們帶著熱望和焦慮,圍繞AI爭辯幾類經典商業問題:
第一,技術革命的本質:此次AI技術突破能走多遠?
第二,改變商業的路徑:它會先影響哪些產業,以及對哪些產業影響更大?
第三,技術和商業的關系:它對現有的商業是無情的顛覆者,還是偉大的賦能者?它是少數玩家的游戲,還是很多人的機遇?
第四,擁抱技術的方式:對于抓住這次機遇,有哪些值得借鑒的經驗和教訓?
美國科技公司“AI 七姐妹”:領跑者的七個啟示
美國前七位的科技公司,包括微軟、英偉達、蘋果、谷歌、亞馬遜、臉譜和特斯拉,也被稱為“AI七姐妹”。它們既包括了最先進的算力領導者,最前沿的大模型,也包括了數字化成熟度最高、數據最豐富的應用場景,同時因為其海量用戶,是最重要的新AI技術的普及推廣者。可以說,這七家企業是當下全球AI商業最重要的引領者與代表者。
因此,七姐妹的AI實踐和效果,可以給我們帶來很多啟示,從而理解本次AI革命日漸清晰的一些確定性趨勢。
在這篇系列文章中,我將以“AI七姐妹”為研究對象,把已經表現出來的商業特征總結成七個啟示:
第一,單一還是多元:智能的本質決定了大模型不會贏家通吃。一個多元、多層(包括通用大模型、產業大模型、專業大模型的不同組合)、多玩家的產業生態格局正在全球形成。
第二,賦能還是顛覆:AI對于沒有豐富數據場景的產業,影響不大;而對于有豐富數據場景的產業,在現階段是偉大的賦能者,而非顛覆。
第三,戰略還是工具:AI對于有的企業是減肥增肌,而對有的企業,已經起到了戰略升級和重構的顯著效果。這是一個如何擁抱AI革命的關鍵問題。其差別除了和行業本質有關,也取決于企業的認知力、決策力、執行力。
第四,閉環還是開放:Meta的AI開源生態戰略,是2023年在AI商業領域最重要的事件,也代表了開放協同、而非自閉環,是AI商業發展最重要的方向。
第五,鏟子還是挖礦:AI基礎設施的建設者,即“鏟子”,成為早期最大的受益者,但大部分AI紅利會逐漸轉移到應用端,即挖礦者。
第六,技術還是商業:科技的成功不等于商業的成功。技術的優勢短暫易逝,商業的持續成功取決于是否能構建融合技術和商業的護城河。
第七,中心化還是去中心化:企業可以前所未有的大,創業者也是前所未有的多。這是大企業的時代,也是所有人的游戲。數字革命從互聯網走入AI,對商業的根本影響在進入一個新的階段。
這七個啟示,前兩個有關AI的技術本質所定義的經濟和商業游戲規則,后五個則是商業擁抱AI的方式和效果。所謂啟示,指的是事先答案未明、事后能予人頓悟的認知。
第一個啟示:單一還是多元?
01
大模型會是多少玩家的機會?
一個最讓人關心的話題是,AI技術會以何種方式改變商業格局?大模型會是多少玩家的機會?
幾個因素的結合,讓人們產生了大模型企業會幾家獨大,甚至贏者通吃、催生超級App的早期判斷。首先是ChatGPT面世以后,在從零到一階段沒有競爭對手,猶如明月獨懸,很容易讓人產生一騎絕塵的印象。其次,每一次GPT升級,都會淘汰上千個中間層功能,表現了強大的通用學習替代能力。
于是就產生了這樣的觀點:從邏輯上看,更多的數據→更先進的模型→更好的產品→更多用戶→更多數據。機器智能和大數據以及應用場景的結合,會放大大模型的網絡效應和規模回報。同樣重要的是,和以往不同,機器智能是一種學習型技術,能夠從數據中學習知識和邏輯,沉淀到神經網絡中,從而脫離對已經學習過的數據的依賴。這樣大模型會越來越聰明和有主導力,形成一種智能黑洞,甚至不需要中間層的協同。如果大模型和大數據能夠形成正向飛輪,并且攫取數據的價值,這兩個特征若同時成立,則意味著大模型會越來越集中,越來越有價值,甚至形成大模型主導的超級APP。
不少實踐者認同這個觀點。例如,百度創始人李彥宏認為,目前“百模大戰”是在浪費社會資源,兩三個大模型就足夠了,同時會逐步出現三五個超級應用,以及數以百萬計、甚至千萬計的各種應用。OpenAI創始人薩姆·阿爾特曼(Sam Altman)也認為,很多創業公司不應該浪費資源發展中間層,最終可能更多是調用API的模式。大模型的勢能是如此之大,以至于原微軟全球執行副總裁陸奇在2023年指出,“OpenAI肯定會比谷歌大,只是大多少倍的問題”。
事實上,大模型從問世以來的技術爆發初級階段,其發展的核心趨勢和以上判斷相差甚遠。
首先在基礎大模型層面,美國有多家并行發展,且在核心能力上沒有代差。OpenAI的GPT在引領本輪AI從零到一的突破之后,很快遇到各種出身不同的強有力的追趕者。無論大科技公司谷歌基于多模態數據開發的Gemini,OpenAI之外另一個創業公司Anthropic的Claude,馬斯克創立的xAI所開發的Grok-2,甚至Meta的開源模型Llama,其表現和GPT相比都不遜色。圖1為大模型不同測評項目中,提到的5家大模型得分對比,可以看到,沒有一個模型具有顯著優勢。
圖1:美國頭部大模型測評得分對比,上述各項指標包括GPQA(理科博士難題)、MMLU(大規模多任務語言理解)、MMLU-Pro(MMLU優化版)、MATH§(數學問題)、HumanEval(編程能力)、MMMU(大學學科知識水平)、MathVista(多模態數學問題)、DocVQA(文檔視覺問答) 。Gemini 1.5 Pro 的分數發布于2024年4月,GPT-4o 的分數發布于2024年5月;Claude 3.5 Sonnet 分數發布于2024年6月;Llama 3 的分數發布于2024年7月;Grok-2 的分數發布于2024年8月。
鑒于模型能力拉不開代差,如圖2所示,國內外大模型企業,以OpenAI和通義千問為例,從2023年已經開始了激烈的價格戰,旗艦大模型價格下降了90%以上。同時,為進一步壓低推理應用的價格,各模型廠商推出的以效率為主的小模型,token價格又不及旗艦大模型的1/10,openAI-4o-mini 價格為0.24美元/百萬Token, 通義千問的Qwen2.5-Turbo 更是低至0.3元人民幣/百萬token。
當下各種大模型拉不開差距的競爭,不但與贏家通吃的預想相差甚遠,而且已經改變了大模型企業的現金流能力和發展路徑。未來,大模型的方向有何可能?原則上,大模型未來的發展方向要么需要有足夠大的規模能夠承接低利潤的模式;要么能夠很快轉化成應用收入;要么能夠給出實現類似目標的清晰路徑,從而獲得融資。競爭足夠激烈,對現金流的確定性就提出了很大的要求。
圖2:國內外大模型近1年持續降價情況;國外以OpenAI,國內以通義千問為例。
02
產業大模型與專業大模型的涌現
除了基礎大模型,還有很多產業大模型和專業大模型在不斷產生。尤其重要的是,這些大模型追求的不是最先進的通用智能,而是能夠在現實的產業場景中實現價值創造,也就是追求大模型和大數據結合的轉化效率。
比如參數的最大化不再是絕大部分大模型的追求目標,這是因為參數越大,調用效率就越低;最好的大模型,實際上是在有限的參數下更加有效地解決現實中的問題。這對大部分企業意味著,企業需要關心的問題不是什么是最先進的大模型,而是什么大模型能夠最有效地帶來商業價值。如圖3所示,新一代的小模型表現優異,雖不優于最新大模型版本,但已經比上一版本的大模型更加優秀。
圖3:模型廠商推出新一代通用大模型時,會同時發布性價比高的小模型版本。今年5月發布的Gemini 1.5 Flash 是Gemini高速響應的小模型版本,表現優于Gemini 1.0大模型;7月發布的GPT-4o mini 全面碾壓上一代模型 GPT-3.5 Turbo;Llama 3.1 則是在7月推出405B的大模型同時,發布了70B、8B參數的小模型版本,性能全面優于4月推出的Llama 3.0版本;10月更新的Claude 3.5 Haiku小模型表現已經優于3月推出的 Claude 3 Sonnet 大模型。
實際上,這些小模型搭配具體的應用場景和數據,在特定任務上的表現不弱于通用旗艦大模型。如圖4,利用產業內專業數據訓練的小模型在特定產業內的能力測評已經超越GPT4通用模型。
圖4:醫療領域,谷歌的Med-PaLM2利用大量醫療專業數據訓練,在23年4月發布的測評結果中優于當時最強大模型GPT4-base;法律領域,24年7月發布的法律垂直模型SaulLM,使用5400億 token 專業法律數據訓練,表現優于GPT-4; 金融領域,軒轅3.0在24年9月金融場景任務的測評中,超越GPT-4o;數學領域,24年9月發布的Qwen2.5-Math 通過更高質量的數學數據訓練,在多項數學測試中優于GPT-4o。
可見,由大量專業數據訓練出的產業小模型,雖然參數只在13B 到340B 之間,與GPT-4的1800B(據稱)相差甚遠,但在不同專業領域的表現都各自超過GPT-4。
其次,不是追求大模型的大、而是大模型結合數據應用的有效性,這個趨勢正在很多國家發生?,F在美國、中國、歐洲是主要的AI大模型研發區域,大部分以追求實際價值為目標,而非大模型軍備競賽。比如法國的Mistral AI,通過有限程度開源,以相對小的參數量(1230億)追求普及效果。德國的大模型企業代表Aleph Alpha,定位是德國自己的“Open AI”,開發的大模型Luminous包括130億、300億和700億三種參數。并針對歐洲各國語言習慣和歐盟法規,推出了針對性的Pharia-1-LLM語言模型,雖然只有70億參數,但專業化的訓練使得其滿足企業、政府的需求。
被谷歌收購、但代表英國AI發展水平的DeepMind,其代表產品是Alpha專業大模型系列,如AlphaGo圍棋機器人,AlphaFold蛋白質預測模型,AlphaCode代碼生成工具。還有全球研究人員合作研發的通用大模型,例如由BigScience發布的BLOOM系列模型。這些模型都不是以參數大,而是以專業能力為特征。
所以,雖然Open AI仍然是風向標,但在過去兩年中,一個多元、多層(包括芯片、云計算、通用大模型、產業大模型、專業大模型的不同組合)、多玩家的AI產業生態正在全球形成。這個生態最核心的發展目標,是以實際的需求和價值實現為引擎,來推動大模型的技術迭代。這個多玩家生態,意味著個別的通用大模型不會主導產業格局,也沒有形成超級APP的趨勢。
當然,大模型技術本身還在快速演化中。一個重要的趨勢,是從原來注重通過“大力出奇跡”,訓練出來的相對簡單的推理能力,到更加注重在實際推理應用階段,能夠延長推理時間,構建思維鏈和決策鏈,從而可以解決相對復雜的推理問題。比如Open AI最新的O1模型,其核心進步,就是學會延長實際應用時的推理時間,這已經在科學等領域帶來顯著效果。
這個轉變非常類似心理學家丹尼爾·卡尼曼(2002年獲得諾貝爾經濟學獎)在其名著《快思考,慢思考》中說描述的人類的兩種思維方式,即在生活中大量像條件反射式的“快思考”(淺推理能力),以及應對復雜問題時所需要的“慢思考”(復雜推理能力)。大模型技術在探索復雜推理能力,也就更加符合人類的思維模式。機器智能與人類智能,雖然發展路徑不同,但最基本的規律,兩者都繞不過去。
但這個從快思考到慢思考的大模型技術演變,并沒有改變前速趨勢。第一,因為各種大模型都會做類似的嘗試,沒有跡象表明哪一家企業可以絕對拉開代差。第二,注重復雜思維和決策能力,會更加需要高質量的產業數據和知識技能(know-how)。所以前述的幾個主要趨勢,不會因為大模型技術的演化而逆轉,反而會強化產業和專業大模型的優勢。
03
智能的本質是什么?何以智能?
AI革命以來,這些正在發生的趨勢,幫我們更好地理解了什么是智能,以及智能迭代的最佳路徑。
智能在本質上可以被理解為“推理?信息?應用”,在這個時代就是“大模型?大數據?應用”。AI就像不同聰明程度的人一樣,本質上是一種信息處理技術(information processing technology),即通過對信息的處理,在應用中實現價值。這意味著智能的獲取和迭代包含了推理能力、信息質量、應用效果三個環節。
圖5:通過推理?信息?應用實現推理能力對現實應用場景的賦能。
基于這個本質,智能的進化有兩種可能性:一種是大模型主導數據和應用的越來越快的正循環,形成“AI?數據的黑洞”,其結局就是強者恒強,甚至贏家通吃。在很多年以前,類似的“數據黑洞”的說法就已經存在)。第二種可能性,則是AI技術方、數據方和應用場景方沒有一方絕對主導,最終呈現的是多方參與的豐富生態。過去兩年表明,數據質量被限制在公共數據領域的大模型,可以具備一定的通用分析能力,但并不是深入懂產業或者應用場景的專家,這決定了第二種可能性是智能迭代的發展路徑。
一方面,這意味著AI產業格局未來的發展,是模型方、數據方、業務方協同的方式,而非大模型主導,這實際上定義了AI產業的多玩家格局和發展方向;另一方面,因為大模型、數據、應用組合和進化的不同,未來存在不同維度、不同層次,以及產業化、個性化的智能。
對于眾多產業和創業者來說,這無疑是一個好消息。由于成功不僅僅依賴于技術本身,還需要其他關鍵因素的配合,這表明在AI領域, AI的商業設計可能比技術本身更為關鍵。
總結
AI產業的未來
在這里,我們總結一下這個啟示的幾個有價值的思考和觀點:
第一,自大模型問世到快速發展的的兩年中,從Open AI一家獨秀,已經發展出幾個明顯的趨勢:
1.通用大模型之間,無論源自大科技公司還是創業公司,在效果上拉不開代差,競爭激烈。
2.因為激勵競爭,大模型以及推理價格都急劇下降。
3.大模型中的小模型,搭配具體的應用場景和數據,在特定任務上的表現不輸通用旗艦大模型,而且成本更加有競爭力。
4.在當前的人工智能領域,除了基礎大模型之外,產業大模型和專業大模型正逐漸成為推動行業進步的關鍵力量。這些模型的目標并非追求最前沿的通用智能,而是專注于在實際產業環境中創造價值。它們追求的是大模型與大數據結合的效率,即如何將大模型的潛力與實際數據有效結合起來,以實現價值有效轉化,這種趨勢在全球范圍內正在興起。
5.目前,全球范圍內正在構建一個多元化、多層次的產業生態體系,其中涵蓋了通用大模型、行業大模型以及專業大模型的多樣化組合。在這個生態系統中,多個參與者共同推動著行業的發展。并沒有跡象顯示某個單一的大模型能夠獨占鰲頭,同樣,也沒有跡象表明會基于這些大模型發展出壟斷市場的超級應用APP。
6.大模型技術本身正在快速演化,從注重預訓練的快思考,到注重應用階段的慢思考,從而提升復雜推理能力。但前述的幾個主要趨勢,不會因為大模型技術的演化而逆轉,反而會強化產業和專業大模型的優勢。
第二,這些趨勢可以幫我們更好理解智能的本質。智能本質上是一種數據處理技術(information processing technology),即通過對數據的處理,在應用中實現價值;這樣,智能的三個環節:“推理?信息?應用”,都很重要。這意味著智能的迭代有兩種可能性。一種是推理能力主導數據和應用場景,形成AI黑洞,甚至贏家通吃。另外一種可能性是推理能力、數據資產和應用場景是相互協同并存的關系。第二種可能性被證明更接近現實。
第三,一方面,這意味著這是一個多玩家的產業格局,和互聯網時代非常不一樣。另一方面,這也意味著每個產業、每個企業、甚至每個人,未來都可能擁有屬于自己的大模型。
未來,AI產業會呈現什么樣的格局?大概率未來的發展不會是一個包打天下的天才,而是有很多很多更加聰明的專家,這是AI產業的未來。
摘自-為溪進化派
上一篇 | 下一篇 |
---|---|
偉大投資的三個特點 | 沒有上一篇 |