心智圖資源庫 AIGC市場分析
2024年AIGC的市場分析,中美現狀,投資關鍵點,乾貨滿滿,有興趣的夥伴可以參考使用!
24年雷克薩斯二手車管理
社區居民家事需求普查後大數據分析
行銷策略
直播電商市場特徵
軟體系統-圖書館系統需求分析
TDM市場分析
AI人工智慧知識
寵物市場消費需求分析心智圖
100個常用的DeepSeek提示詞(分類)
DeepSeek30個餵飯級指令
生成式AI追蹤與展望
底層模型能力現狀
MLLM
OpenAI-GPT4(V/Turbo)
Anthropic-Claude3
Google-Gemini 1.5, Gemma
Mistral AI & Meta & Bigcode…
Domestic players
多模態生成
OpenAI-DallE3, Sora
Stability AI – Stable Diffusion3
Midjourney – MJ V6
Google & Runway &…
Embodied AI
Google/Deepmind:Robotic Transformer, Palm-E
Tesla:FSD, Optimus
Institute:VoxPoser, ALOHA
技術迭代
文字類別 (Text)
底層路線較清晰,多基於Transformer底層中Decoder-only的架構發展改良,結合MOE和多模態embedding等
影像生成 (Image)
底層路線較清晰,先前參考擴散底層中的Stable Diffusion結構,目前升級為Diffusion Transformer
影片生成 (Video)
核心結構複雜,最佳化點多,包括編解碼器、Patch化、Diffusion模組,Transformer模組、Clip模組和插幀模組
三維資產生成 (3D)
底層技術路線不清晰,有許多結構,例如Nerf、擴散模型等
具身模型 (Embodied)
底層技術路線不清晰,例如利用VLM和LLM集合,但在推理和操作層面存在多種技術邏輯
應用落地
開源模型
Llama2、Gemma
Starcoder2, CodeLlama
SD系列
GPT Store
從插件市場到GPTs,早期熱度高,但長期優秀的產品仍需要專業開發者開發
Fine tuning
MOE和RAG等技術對Finetuning實現部分替代,FT仍需要改善災難性遺忘和更新時效問題
RAG
和向量資料庫結合,在專業領域成本低、更新頻率快且提升回答精準度降低幻覺,未來將大規模應用
Prompt Engineering
短期剛需長期終端需求可能降低,目前幫助用戶自動擴充prompt和機器align的演算法發展快
模型壓縮
分為量化、壓縮和剪枝等,應用剛需,尤其需要本地部署的C端和B端模型
Agent
應用廣泛,但是發展初期,底層模型的reasoning、規劃和幻覺問題需要解決
中美AI Native主流場景與產品
美國
Chatbot
ChatGPT, Claude, Bard
AI Search Engine
Perplexity,Phind
AI Image Editing/Generating
Remove.bg, Leonardo.AI, Yodayo,PixAI, SeaArt, Midjourney
AI Writer Generator
AI Character Generator
Character AI、Janitor AI,CrushOn
AI Tools for Education
Q-Chat, Cheggmate
Other productivity
Eleven labs, Gamma, Eightify
中國
經過接近2年的持續觀察和跟踪,部分場景的頭部企業辨識度變高,優秀企業也逐步和行業其他玩家拉開差距,例如MLLM和Chatbot,代碼生成應用、視頻生成的應用產品、法律、醫療均出現了頭部企業
投資機會
底層模型供應商
投密度高,人才密度、資金密度、算力密度
技術和團隊辨識度高,易壟斷核心資源,取得相對的領先優勢
存在技術迭代風險,更好的開源以及更新的模型架構都有可能降低現有底層模型廠商的技術優勢
應用層產品(軟體或硬體)
投當前模型容易做的場景,不急於最佳化模型
借助最優模型技術迅速取得PMF與營收,技術風險小
但大部分產品同質化,需要尋找能持續累積障礙的商業模式
資訊差帶來的產品事先規劃
端對端產品
投生態位最明確,頭部辨識度最高的企業
場景選擇:剛需痛點、產品有一定要求、客戶願意支付高客單(最好能帶來創收)
資料優勢:特定場景的資料來源
產品迭代:可做厚,遷移成本高
營運數據:用戶續約/CAC/客單價等