AI與區塊鏈融合:重塑產業鏈價值與未來發展趨勢

AI行業的演進與區塊鏈融合前景

人工智能行業在近期取得了長足進展,被視爲第四次工業革命的關鍵驅動力。大型語言模型的出現顯著提升了各行各業的工作效率,波士頓諮詢公司認爲GPT爲美國整體提升了約20%的生產力。同時,大模型所具備的泛化能力被認爲是一種全新的軟件設計範式,有別於過去精確編碼的方式,現在的軟件設計更多地採用泛化性更強的大模型框架,能夠支持更廣泛的模態輸入和輸出。深度學習技術爲AI行業帶來了新一輪繁榮,這股熱潮也逐漸蔓延至加密貨幣行業。

本報告將深入探討AI行業的發展歷程、技術分類,以及深度學習技術對行業產生的影響。我們將剖析深度學習領域中GPU、雲計算、數據源、邊緣設備等產業鏈上下遊的現狀與發展趨勢。同時,我們也將從本質上探討加密貨幣與AI行業的關聯,並對加密貨幣相關的AI產業鏈格局進行梳理。

AI行業發展歷程

AI行業自20世紀50年代起步以來,學術界和產業界在不同時期、不同學科背景下,發展出了多種實現人工智能的流派。

現代人工智能技術主要採用"機器學習"這一術語,其核心理念是讓機器通過數據在特定任務中反復迭代來提升系統性能。主要步驟包括將數據輸入算法,利用數據訓練模型,測試部署模型,最後使用模型完成自動化預測任務。

目前機器學習主要有三大流派,分別是聯結主義、符號主義和行爲主義,它們分別模仿人類的神經系統、思維和行爲。其中以神經網路爲代表的聯結主義目前佔據主導地位(也稱爲深度學習)。神經網路架構包含輸入層、輸出層和多個隱藏層,當層數和神經元(參數)數量足夠多時,就能擬合復雜的通用任務。通過不斷輸入數據調整神經元參數,最終神經元會達到最佳狀態,這也是"深度"一詞的由來 - 足夠多的層數和神經元。

以神經網路爲基礎的深度學習技術也經歷了多次迭代與演進,從最早期的神經網路,到前饋神經網路、RNN、CNN、GAN,最後發展到現代大模型如GPT等使用的Transformer技術。Transformer技術是神經網路的一個演進方向,增加了一個轉換器(Transformer),用於將各種模態(如音頻、視頻、圖片等)的數據編碼成對應的數值表示,然後輸入神經網路,使神經網路能夠擬合任何類型的數據,實現多模態處理。

新人科普丨AI x Crypto:從零到巔峯

AI發展經歷了三次技術浪潮:

第一次浪潮發生在20世紀60年代,由符號主義技術引發,解決了通用自然語言處理和人機對話問題。同期,專家系統誕生,如美國國家航空航天局開發的DENDRAL化學專家系統。

第二次浪潮發生在20世紀90年代,貝葉斯網路和基於行爲的機器人學提出,標志着行爲主義的誕生。1997年,IBM深藍戰勝國際象棋冠軍卡斯帕羅夫,被視爲人工智能的一個裏程碑。

第三次浪潮始於2006年。深度學習概念提出,以人工神經網路爲架構,對數據進行表徵學習。隨後深度學習算法不斷演進,從RNN、GAN到Transformer和Stable Diffusion,塑造了這次技術浪潮,也是聯結主義的鼎盛時期。

期間發生了多個標志性事件:

  • 2011年,IBM的Watson在《危險邊緣》問答節目中戰勝人類選手。
  • 2014年,Goodfellow提出GAN(生成對抗網路)。
  • 2015年,Hinton等人在《自然》雜志提出深度學習算法,引起巨大反響。OpenAI成立。
  • 2016年,AlphaGo戰勝圍棋世界冠軍李世石。
  • 2017年,Google提出Transformer算法,大規模語言模型開始出現。
  • 2018年,OpenAI發布GPT,DeepMind發布AlphaFold。
  • 2019年,OpenAI發布GPT-2。
  • 2020年,OpenAI發布GPT-3。
  • 2023年,基於GPT-4的ChatGPT推出,迅速達到一億用戶。

新人科普丨AI x Crypto:從零到巔峯

深度學習產業鏈

當前大語言模型主要採用基於神經網路的深度學習方法。以GPT爲代表的大模型掀起了新一輪人工智能熱潮,大量玩家湧入這一領域,市場對數據和算力的需求激增。本節將探討深度學習算法的產業鏈構成,以及上下遊的現狀、供需關係和未來發展。

基於Transformer技術的GPT等大語言模型(LLMs)訓練主要分爲三個步驟:

  1. 預訓練:輸入大量數據對來尋找神經元的最佳參數。這個過程最耗費算力,需要反復迭代嘗試各種參數。

  2. 微調:使用少量但高質量的數據進行訓練,提升模型輸出質量。

  3. 強化學習:建立一個"獎勵模型"來評估大模型的輸出質量,通過這個模型來自動迭代大模型的參數。有時也需要人爲參與評判。

簡而言之,預訓練對數據量要求高,耗費最多GPU算力;微調需要高質量數據來改進參數;強化學習通過獎勵模型反復迭代參數以提高輸出質量。

影響大模型表現的三個主要因素是:參數數量、數據量與質量、算力。這三者共同決定了大模型的結果質量和泛化能力。假設參數數量爲p,數據量爲n(以Token數量計算),可以通過經驗法則估算所需的計算量,從而預估所需的算力和訓練時間。

算力通常以Flops爲基本單位,代表一次浮點運算。根據實踐經驗,預訓練一次大模型大約需要6np Flops。推理(輸入數據等待模型輸出的過程)則需要2np Flops。

早期AI訓練主要使用CPU芯片,後來逐漸被GPU替代,如Nvidia的A100、H100等。GPU在能耗效率上遠超CPU,主要通過Tensor Core模塊進行浮點運算。芯片的計算能力通常以FP16/FP32精度下的Flops來衡量。

以GPT-3爲例,其有1750億個參數,1800億個Token的數據量(約570GB)。進行一次預訓練需要3.15*10^22 Flops,相當於一張Nvidia A100 SXM芯片需要584天。考慮到GPT-4的參數量是GPT-3的10倍,數據量也增加了10倍,可能需要100倍以上的芯片算力。

在大模型訓練中,數據存儲也是一個挑戰。GPU內存通常較小(如A100爲80GB),無法容納全部數據和模型參數。因此需要考慮芯片的帶寬,即數據在硬盤和內存間的傳輸速度。多GPU協同訓練時,芯片間的數據傳輸速率也很關鍵。

新人科普丨AI x Crypto:從零到巔峯

深度學習產業鏈主要包括以下幾個環節:

  1. 硬件GPU提供商:目前Nvidia處於絕對領先地位。學術界主要使用消費級GPU(如RTX系列),工業界主要使用H100、A100等專業芯片。Google也有自研的TPU芯片。

  2. 雲服務提供商:爲資金有限的AI企業提供彈性算力和托管訓練解決方案。主要分爲三類:傳統雲廠商(如AWS、Google Cloud、Azure)、垂直AI雲算力平台(如CoreWeave、Lambda)、推理即服務提供商(如Together.ai、Fireworks.ai)。

  3. 訓練數據源提供商:爲大模型提供大量數據或高質量數據。Google、Reddit等擁有大量數據的公司受到關注。也有專門的數據標注公司爲特定領域模型提供數據。

  4. 數據庫提供商:AI訓練推理任務主要使用"矢量數據庫",用於高效存儲和索引海量高維矢量數據。主要玩家包括Chroma、Zilliz、Pinecone、Weaviate等。

  5. 邊緣設備:爲GPU集羣提供散熱和供電支持。包括能源供應(如地熱、氫能、核能)和冷卻系統(如液冷技術)。

  6. 應用:目前AI應用主要集中在搜索、問答等領域,留存率和活躍度普遍低於傳統互聯網應用。應用主要分爲面向專業消費者、企業和普通消費者三類。

新人科普丨AI x Crypto:從零到巔峯

加密貨幣與AI的關係

區塊鏈技術的核心是去中心化和去信任化。比特幣創造了一個去信任的價值轉移系統,以太坊則進一步實現了去中心化、去信任的智能合約平台。從本質上看,區塊鏈網路是一個價值網路,每筆交易都是以底層代幣爲基礎的價值轉換。

傳統互聯網中,價值通過P/E等指標體現在股價上。而在區塊鏈網路中,原生代幣(如ETH)體現了網路的多維度價值,不僅可以獲得質押收益,還可作爲價值交換媒介、價值存儲媒介、網路活動消費品等。

代幣經濟學(Tokenomics)規定了生態系統結算物(原生代幣)的相對價值。雖然無法爲每個維度單獨定價,但代幣價格綜合反映了多維度的價值。一旦爲網路賦予代幣並使其流通,就能實現遠超傳統股權的價值捕獲。

代幣經濟學的魅力在於能爲任何功能或思想賦予價值。它重新定義和發現價值,對包括AI在內的各行業都至關重要。在AI產業中,發行代幣可以重塑產業鏈各環節的價值,激勵更多人深耕細分賽道。代幣還能爲基礎設施提供額外價值,促進"胖協議瘦應用"範式的形成。

區塊鏈技術的不可篡改和無需信任特性也能爲AI行業帶來實際價值。例如,可以在保護用戶隱私的前提下允許模型使用數據;可以通過全球化網路分配閒置GPU算力,重新發現剩餘價值。

總的來說,代幣經濟學有助於重塑和發現價值,去中心化帳本則可以解決信任問題,將價值在全球範圍內重新流動。這種結合爲AI產業帶來了新的可能性。

新人科普丨AI x Crypto:從零到巔峯

加密貨幣行業AI產業鏈概覽

  1. GPU供給側: 主要項目包括Render、Golem等。Render作爲較成熟的項目,主要面向非大模型的視頻渲染任務。GPU雲算力市場不僅可服務於AI模型訓練和推理,也適用於傳統渲染任務,降低了對單一市場的依賴風險。

  2. 硬件帶寬: 項目如Meson Network試圖建立全球帶寬共享網路。但共享帶寬對於大模型訓練可能是僞需求,因爲地理位置造成的延遲會顯著影響訓練效率。

  3. 數據: 主要項目包括EpiK Protocol、Synesis One、Masa等。與傳統數據企業相比,區塊鏈數據提供商在數據採集方面具有優勢,能爲個人數據定價並通過代幣激勵用戶貢獻數據。

  4. ZKML: 項目如Zama、TruthGPT等使用零知識證明技術實現隱私計算和訓練。此外,一些通用型ZK項目如Axiom、Risc Zero也值得關注。

  5. AI應用: 目前主要是傳統區塊鏈應用結合自動化和泛化能力。AI Agent(如Fetch.AI)作爲用戶與多種應用的橋梁,有望率先受益。

  6. AI公鏈: 如Tensor、

GPT2.08%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 4
  • 分享
留言
0/400
mev_me_maybevip
· 18小時前
gpt炒过头了 该降温
回復0
fork_in_the_roadvip
· 18小時前
已经看透一切的韭菜
回復0
NotFinancialAdviservip
· 18小時前
GPT玩的明白 炒币这波必上新高啊
回復0
智能合约探险家vip
· 18小時前
ai爆了 其他跟蹆虫
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)