心智圖資源庫 AI行研
這是一篇關於AI行研的心智圖,主要內容包括:商業模式,市場規模,產業鏈分析,基本概念。介紹詳細,描述全面,希望對有興趣的朋友有幫助!
編輯於2024-11-26 10:20:41This template shows the structure and function of the reproductive system in the form of a mind map. It introduces the various components of the internal and external genitals, and sorts out the knowledge clearly to help you become familiar with the key points of knowledge.
This is a mind map about the interpretation and summary of the relationship field e-book, Main content: Overview of the essence interpretation and overview of the relationship field e-book. "Relationship field" refers to the complex interpersonal network in which an individual influences others through specific behaviors and attitudes.
This is a mind map about accounting books and accounting records. The main contents include: the focus of this chapter, reflecting the business results process of the enterprise, the loan and credit accounting method, and the original book of the person.
This template shows the structure and function of the reproductive system in the form of a mind map. It introduces the various components of the internal and external genitals, and sorts out the knowledge clearly to help you become familiar with the key points of knowledge.
This is a mind map about the interpretation and summary of the relationship field e-book, Main content: Overview of the essence interpretation and overview of the relationship field e-book. "Relationship field" refers to the complex interpersonal network in which an individual influences others through specific behaviors and attitudes.
This is a mind map about accounting books and accounting records. The main contents include: the focus of this chapter, reflecting the business results process of the enterprise, the loan and credit accounting method, and the original book of the person.
AI行研
基本概念
人工智慧的技術邏輯關係
DL:深度學習(Deep Learning, DL)就是表示學習RL的最佳體現-深度學習就是用來解決人工建構特徵麻煩而且不準確的問題,優點是機器本身會建構特徵,缺點是看不出來是哪一種因素對結果影響較大。將基礎的演算法封裝,是模型訓練的底座。 ①電腦視覺(Computer Vision, CV) ②自動語音辨識(Automatic Speech Recognition, ASR) ③自然語言處理( Natural Language Processing, NLP) ④專家系統(Expert System, ES)
訓練方式
監督學習(50年代提出)
原理:根據輸入和對應的標籤進行模型訓練,以預測標籤未知的新資料。
半監督學習(80年代提出)
原理:利用標籤資料的資訊和未標籤的分佈式特徵進行模型訓練。
無監督學習(80年代提出)
原理:從無標籤的資料中發現隱藏的模式和結構。
自監督學習(預訓練,2017年後提出)
原理:自我監督學習是一種特殊的無監督學習方法,它利用資料本身的結構和屬性,來自動地產生標籤或特徵,從而進行模型的訓練。
強化學習(微調,2017年後提出)
原理:模型與環境交互,透過試誤學習最優策略,基於獎勵訊號訓練模型,最大化長期累積獎勵。
深度學習框架
介紹:基於NLP(Transformer)、CV(CNN等)兩大類基礎架構衍生出各類大模型,多模態已成趨勢。 大模型依其底層架構以及研發任務領域的特點分為幾個主要類別,包括自然語言處理(NLP)、電腦視覺(CV)、科學計算以及多模態任務等多種,但從底層架構上都分屬NLP和CV兩類。 Transformer是一種全新的編解碼模型架構,並行程度高,適用於處理文字、程式碼這類強連續性生成任務;CNN、GAN、Diffusion等傳統CV架構善於處理影像產生類別任務。由單模態模型在實際訓練時融合其他模態技術,可形成多模態、跨模態大模型,如GPT-4、盤古、 Mid journey等,由於多模態模型可接受文字、影像等不同輸入輸出形式,對應用場景能更廣泛適配,著力研發多模態模型成為趨勢。
NLP大模型
PyTorch框架(Meta)
TensorFlow框架(Google)
飛漿架構(百度)
Transformer框構
Transformer 是一種基於自註意力機制(self-attention Mechanism)的深度學習模型,最初是為了處理序列到序列(sequence-to-sequence)的任務,例如機器翻譯,它是由論文《Attention is All You Need》提出。由於其優秀的性能和靈活性,它現在被廣泛評估各種自然語言處理(NLP)任務。
(1)自註意力機制(Self-Attention Mechanism)自註意力機制是Transformer模型的核心。它允許模型在處理一個序列的時候,考慮序列中的所有單詞,並根據它們的重要性賦予不同的權重。這種機制使得模型能夠捕捉到一個序列中的長距離依賴關係。 (2)位置編碼(Positional Encoding)由於Transformer模型沒有明確的處理序列順序的機制,所以需要加入位置編碼來提供序列中單字的位置資訊。位置編碼是一個向量,與輸入單字的嵌入向量相加,然後輸入到模型中。 (3)編碼器和解碼器(Encoder and Decoder)Transformer模型由多層的編碼器和解碼器很好完成。編碼器用於處理輸入序列,解碼器用於產生輸出序列。編碼器和解碼器都由自註意力機制和前饋神經網路(Feed-Forward Neural)組成網路)組成。 (4)多頭注意力(Multi-Head Attention)在處理自我注意力時,Transformer模型並非只滿足於一個注意力分配,而是產生多個注意力分配,這就是所謂的多頭注意力。多頭注意力可以讓模型在多個不同的表示空間中學習輸入序列的表示。 (5)前饋神經網路(Feed-Forward Neural Network)在自註意力之後,Transformer模型會透過一個前回饋神經網路路來進一步處理序列。這個網路路由兩層全連接層和一個ReLU啟動函數組成。 (6)殘差連接和層歸一化(Residual Connection and Layer Normalization)Transformer模型中的每個子層(自註意力和前饋神經網路)都有一個殘差連接,而其輸出會通過層歸一化。這有助於模型處理深度網路中常見的峰值消失和突然爆炸的問題。
CV大模型
CNN、GAN、VAE等
AI模型介紹
AI模型機制:是指在參數與架構的基礎上建構起來,可以學習到輸入內容與輸出內容之間的關係,從而能根據輸入對輸出進行預測的一種架構,無論普通模型或大模型,其運行邏輯都是一致的,即「訓練推理」。推理的目標是利用訓練過程中學到的知識(模型),將其應用於實際場景中的數據,進行預測、分類、生成等任務。
機制流程:訓練(人類編寫訓練演算法→輸入資料→不斷調整參數→相對精確的演算法(模型)) 推理(輸入資料→不在進行參數調整→產生預測結果)
大模型
具有「預訓練」與「大參數」的特性:大模型性通常有數以億計的參數,由多層神經元組成,使用大規模無標註資料集完成預訓練,之後模型僅需少量資料微調或不調整,就能直接支撐各類應用,完成多個應用場景的任務。
產業鏈分析
上游
基礎層
算力基礎
現況:海外龍頭廠商佔據壟斷地位,AI加速晶片市場呈現「一超多強」態勢,英偉達一家獨大。市場上,英偉達憑藉硬體優勢和軟體生態一家獨大,在訓練、推理端均佔據領先地位。 2022 年資料中心 AI 加速市場中,英偉達市佔率達 82%。 趨勢:目前市場以訓練晶片為主(目前各佔比50%左右),未來推理晶片可望反超(佔65%以上)。從AI晶片的運算功能來看,一開始,因大模型首先要在雲端經過訓練、調優與測試,計算的資料量與執行的任務量數以萬計,故雲端訓練需求是AI晶片市場的主流需求。而在後期,訓練好的模型轉移到端側,結合即時資料進行調優、推理運算、釋放AI功能,微調、推理需求逐漸取代訓練需求,帶動推理晶片市場崛起。預計到2025年,雲端推理與端側推理將成為市場規模成長的主要拉力,提升了逐漸下滑的AI晶片市場規模年增速。
演算法基礎
現況:產業主要收入貢獻來源為電腦視覺類,市場競爭格局分散。 AI技術開放平台中電腦視覺類與語音技術類營收佔比達72.2%,是營收的主要貢獻來源。人臉辨識、人體辨識、OCR文字辨識、影像辨識等構成了電腦視覺類業務的主要技術能力,且電腦視覺類的技術價格相較於其他技術而言更高,應用領域也更為廣泛。現階段的市場集中度相對分散,未來,能持續投入成本、研發出強勁演算法的廠商可望佔領更多的市場份額,市場集中度亦會因此提升。 趨勢:現階段的市場集中度相對分散,未來,能持續投入成本、研發出強勁演算法的廠商可望佔領更多的市場份額,市場集中度亦會因此提升。
數據基礎
現況:由於資料服務門檻不高,2019年中國人工智慧基礎資料服務產業CR5佔26%市場份額,產業集中度較低,品牌資料服務商、中小資料供應商及需求方自建團隊是市場中的主要供應方。 趨勢:隨著預訓練大模型時代的到來,以及人工智慧技術在更多垂直應用場景落地深化,資料標註產業也將走向垂直化、客製化,門檻提高,市場集中度提升。從發展曲線來看,過去產業核心業務邏輯與以監督學習為主的小模型具市場有強相關性,在大模型逐步取代小模型後,傳統資料治理業務將逐步減小,市場將轉向自動化標註工具產業知識圖譜微調階段,資料服務企業業務逐步發展為資料治理應用整合。從發展趨勢來看,一方面大模型大多採用無監督學習的方式進行預訓練,模型可直接大量學習無標註的數據,此外AI輔助標註、自動化數據標註技術快速進步,行業對低質量數據標註的需求減少。另一方面,在自動駕駛、醫療醫藥、小語種、法律、金融等專業性的場景中,模型的落地效果很大程度上取決於是否有高品質標註資料進行微調。因此,資金、研發實力以及專業know-how或成為較高產業門檻,多種因素疊加影響下,產業集中度將提升。
中游
模型層
一般大模型
開源通用大模型
閉源通用大模型
產業垂直型基礎大模型
業務垂直型基礎大模型
企業垂直大模型
工具層
AI Agents
AI應用效率化生產平台
大模式服務平台
下游
應用層
內容消費賽道
創作工具賽道
數位化與大模型方案提供商
金融、零售、政務、電力、醫療、企業內部服務
1.近年來,隨著人工智慧技術及產品在企業設計、生產、管理、行銷、銷售多個環節中得到落地且成熟度不斷提升,下游需求側應用AI的行業也不斷增多,滲透率持續提升,產業整體格局分散。 2.具體來看,數位經濟的高速發展為人工智慧發展創造了良好的經濟與技術環境,而企業、產業的數位化程度也決定了AI產品的落地難度以及應用效能,產業數位化程度越高,AI規模化落地速度越快。
市場規模
整體市場狀況(2022年1958億)
2022年中國人工智慧產業規模達1,958億元,到2027年,人工智慧產業整體規模可望達到6,122億元,2022-2027年的相關 CAGR=25.4%。
上游市場狀況:2022年總市場規模1,084億,佔43.8%
算力晶片市場(2022年647億):2022年國內647億,到2025年,我國AI晶片市場規模或將達到1385億元,2023-2025年的相關CAGR=46.3%。
演算法服務市場(2022年376億)
數據服務市場(2022年64億):2023年,中國AI數據服務市場規模預計為64億元,至2025年將達到107億元,2023-2025 CAGR=29.3%。
中下游模型、工具及應用:2022年總市場規模1,389億,佔56.2%
模型層市場規模(2022年169.5億)
工具層市場規模(2022年101.4億)
其他AI軟體或應用市場規模(2022年1116.8億)
商業模式
中游
模型層
一般大模型
閉源通用大模型:採用基礎能力免費 加值服務收費的模式或為雲端服務引流模式變現。 開源通用大模型商業模式:1)訂閱會員:獲得特定的服務或特權;2)生成量:根據用戶在平台上使用或生成內容量計費;3)第三方應用插件:提供API或工具,引進開發者創建整合應用。模型廠商透過出售這些應用程式、插件或提供高級功能來獲得收入,平台從中抽成
產業垂直型基礎大模型
業務垂直型基礎大模型
商業模式:企業將微調好行業/業務大模型的以服務的形式提供給客戶使用,客戶可透過API調用,收費基於訂閱時間、使用量、調用次數等
企業垂直大模型
商業模式:為有私有化部署需求的客戶提供企業專屬大模型,收費以服務內容和類型為基礎。
工具層
AI Agents
商業模式:1)面向開發者:作為深度學習自動化流程工具,提供Agents開發的邏輯框架,幫助開發者創建基於大語言模型的端到端應用程式或流程,目前主要是開源模式;2)面向客戶端:利用大模型的程式碼產生能力,打通語音/文字輸入層,與軟/硬體層執行層的鴻溝,實現AI自動化,目前主要作為模型附加功能收費。
AI應用效率化生產平台
商業模式:幫助客戶開發小模型,作為整合了演算法與算力的低程式碼或無程式碼平台,供用戶建置、部署和管理AI應用模型,按呼叫量或節點收費。
大模式服務平台
商業模式:大模型時代的新產物,AI應用模型效率化生產平台的升級版,提供多種基礎大模型,供用戶選擇並微調專屬大模型,按調用量收費或節點收費。