Mindmap-Galerie 【AIGC】 6 AIGC -Anwendungskarten
Da die Technologie für künstliche Intelligenz weiterhin durch Durchbrüche und Iterationen erzielt wird, ist das Thema der generativen KI viele Male populär geworden, und die industrielle Entwicklung, die Marktreaktion und die entsprechenden regulatorischen Anforderungen der Erzeugung künstlicher Inhalte des Inhalts in der künstlichen Intelligenz (AIGC) haben auch weit verbreitete Aufmerksamkeit erhalten. Yitu nimmt den Inhaltsgenerierungsmodus als Perspektive ein, die die technologische Entwicklung, die wichtigsten Fähigkeiten und die typischen Anwendungsszenarien von AIGC in den Bereichen Bildgenerierung, Audiogenerierung, Videogenerierung, dreidimensionale Generation, Sprachgenerierung, molekulare Entdeckung und Schaltungsdesign (Bildgenerierung) sowie die Herausforderungen, die durch verschiedene AIGC-Industrien in My Countries in My Countries in My Countries und ihren Proviant und ihren Proviant, in den Proviants und ihren Aussichten vorgestellt wurden, abdeckt.
Bearbeitet um 2025-02-10 15:40:35Ceci est une carte mentale sur la carte mentale des experts en bourse (version détaillée).
This is a mind map about the mind map of stock trading experts (detailed version). The main contents include: 1. Mindset management, 2. Basic knowledge, 3. Technical analysis, 4. Fundamental analysis, 5. Trading strategy, 6. Risk control, 7. Continuous evolution.
Questa è una mappa mentale sulla mappa mentale degli esperti di trading azionari (versione dettagliata).
Ceci est une carte mentale sur la carte mentale des experts en bourse (version détaillée).
This is a mind map about the mind map of stock trading experts (detailed version). The main contents include: 1. Mindset management, 2. Basic knowledge, 3. Technical analysis, 4. Fundamental analysis, 5. Trading strategy, 6. Risk control, 7. Continuous evolution.
Questa è una mappa mentale sulla mappa mentale degli esperti di trading azionari (versione dettagliata).
Cogvideo
Implementierungsprinzip: COGVIDEO ist ein großflächiges Model mit Textvideo-Generation, das auf der Autoregressionsmethode basiert. Für und Wider: Vorteile: Dieses Modell unterstützt die chinesische Eingabeaufforderung. Nachteile: Die Länge der Eingangssequenz gibt Beschränkungen.
Herausforderung der Produkt Usability
Videoproduktionsgeschwindigkeit, Komfort, Integration von Inhalten und Interaktivität
Stabile und kontrollierbare Herausforderung
Dauerkontrolle, Inhaltskontrolle, Nutzung und Schulung begrenzter Daten, Erzeugungsergebnisse und Prozessanpassung
Material Urheberrecht, Privatsphäre und Sicherheit, Ethik
Compliance -Anwendungsherausforderungen
Videostil -Migration
● künstlerischer Ausdruck von Film- und Fernsehwerken ● Konvertierung im Werbestil
● Film- und Fernseh-/Werbeaufführungsoptimierung ● Reparatur alter Filme und kostbaren Bilddaten ● Verbesserte Sicherheitsüberwachung und medizinische Bildqualität
Videoverbesserung
● Virtuelle Szenen, Charaktere und Spezialeffektegenerierung ● Film Trailer Generation ● Video -Anzeigengeneration ● Dynamische menschliche Körperstruktur und Krankheitsmodellgenerierung
Videogenerierung
● Postproduktion Bearbeitung und Spezialeffektverarbeitung von Film und Fernsehen Ur
Videobearbeitung
● Sicherheitsüberwachung und Frühwarnung, intelligentes Verkehrsmanagement ● Marketing -Inhalts -Etikettengenerierung, Stimmungsanalyse ● Film- und Fernsehanalyse
Videoinhaltserkennung
● Übergangseffekt zwischen Frames ● Kontinuität der Aktion ● Die Glätte des Bildes ● Glattes Schalten von Szenen
Kontinuität
● hohe Auflösung ● Der Realismus der Szene und der Charaktere ● Klare und reiche Bilddetails ● Die Logik des Videoinhalts
● Die Videolänge ist variabel und steuerbar ● Relevanz für eine bestimmte Beschreibung ● Videoattribute und Videoelemente sind kontrollierbar und bearbeitetbar
Kontrollierbarkeit
Realismus
Prinzipien der Implementierung und Vor- und Nachteile des Mainstream -Modells
● Mainstream -Modelle:
Imagin-video
Gen
Implementierungsprinzip: Image-video ist ein Videomodell, das auf Textbedingungen basiert, die basierend auf dem Bildmodell entwickelt wurden. Für und Wider: Vorteile: Die generierten Videos haben High -Treue, Kontrollierbarkeit und Weltwissen, unterstützen die Erzeugung verschiedener Videos und Textanimationen in verschiedenen künstlerischen Stilen und können 3D -Objekte verstehen. Nachteile: Die vom Kaskadierungsmodell verwendete parallele Trainingsmethode erfordert hohe Rechenressourcen.
Implementierungsprinzip: Das Gen-Modell lernt über das potenzielle Diffusionsmodell Text-Image-Funktionen und kann neue Videos basierend auf einer bestimmten Texteingabeaufforderung oder einem Referenzbild generieren oder Bilder mit dem Aufnehmen von Bildstilkonvertierungen basierend auf dem Originalvideo durchführen. Für und Wider: Vorteile: Dieses Modell hat eine gute Leistung in der Video -Rendering und im Stilumwandlungen, und das generierte Video verfügt über eine starke Fähigkeit zur Künstler- und Bildstruktur, die sich besser an die Anforderungen an die Modellanpassung anpassen kann. Nachteile: Das Gen -Modell hat immer noch Einschränkungen bei der Stabilität der generierten Ergebnisse.
● Inländische und ausländische repräsentative Modelle:
Ist es Open Source?
Organisation
Einführung
Modell
Nicht Open Source
Das Text-Video-Generierungsmodell basierend auf Diffusionsmodell hat die Vorteile der Erzeugungsgeschwindigkeit, der guten Videoqualität und der Fähigkeit, eine Vielzahl von künstlerischen Stilen und 3D-Objekten zu verstehen.
Imagin Video
Make-a-video
Meta
Nicht Open Source
Es sind keine Text-Video-Daten erforderlich. Verwenden Sie ein Text-Image-Datentraining, um die Videogenerierung zu erreichen. Dies verbessert die Zeit und die räumliche Auflösung generierter Videos
Nuwa-xl
Microsoft Research Institute
Bereits offen auf Github
Das auf Diffusion über Diffusionsarchitektur basierende ultra-lange Videogenerierungsmodell hat eine gute Videoqualität und Kontinuität und kann die Inferenzzeit erheblich verkürzen
Cogvideo
Tsinghua & Zhiyuan
Bereits offen auf dem Umarmungsface
Multi-Rahmen-hierarchische Trainingsstrategie kann Text- und Videos besser ausrichten, und groß angelegte Trainingsdaten verbessert die Qualität der generierten Videos erheblich.
Selbstversuche Diffusionsmodellstufe
Gan/Vae Fließbasiert Generationsphase
Bildnähte Generationsphase
Video erzeugen
● Entkopplung durch Vordergrund und Hintergrund, Bewegung und Inhaltssegmentierung Lösungen, Bildübersetzung und andere Methoden zur Verbesserung des Erzeugungseffekts ● Die Videoqualität ist immer noch gering
● Autoregressives Modell: Rahmenvorhersageerzeugung, gute Kohärenz, aber geringe Effizienz und Fehler sind leicht zu akkumulieren ● Diffusionsmodell: Migrieren Sie die literarische Bildarchitektur in die Videogenerierung mit hoher Wiedergabetreue, aber hohem Ressourcenverbrauch
● Statische Bildstiche zur Bildung eines Videostreams ● Einfach und einfach zu bedienen, aber geringe Videoqualität und schlechte Kohärenz
Film- und Fernsehspiel -Szenenproduktion, Werbung, digitale Leute
Visuelle Postproduktionseffekte
Film- und Fernsehbearbeitung, Videogesichtswechsel
Typische Anwendungen
Transformator-TTs
Implementierungsprinzip: Transformator-TTS ist ein End-to-End-Sprachgenerierungsmodell, das die Transformatorstruktur kombiniert und es auf das TTS-System anwendet. Insbesondere verbessert Transformator-TTs die Trainingseffizienz durch Einführung eines Aufmerksamkeitsmechanismus mit mehreren Kopf, um eine Encoder-Decoder-Struktur zu konstruieren, verwendet Phonemsequenzen als Eingabe, um ein Melspektrum zu erzeugen, und gibt Wellenformen über einen Wellenet-Vokoder aus. Für und Wider: Vorteile: Das Sprachmodell mit der Transformatorstruktur kann die Trainingsgeschwindigkeit beschleunigen und die Probleme mit geringer Trainingsgeschwindigkeit und Schwierigkeiten bei der Festlegung eines langabhängigen Modells in Tacotron2 löst. Nachteile: Es gibt Probleme mit langsamer Inferenz und Modellabweichung, die durch Akkumulation autoregressiver Fehler verursacht werden.
● Inländische und ausländische repräsentative Modelle:
Tacotron2
Implementierungsprinzip: Tacotron2 ist ein End-to-End-Sprachsynthesemodell, das aus einem Schallspektrum-Vorhersage-Netzwerk und einem Vokoder basiert, das auf der Kombination von Wellenet und Tacotron basiert. Unter ihnen extrahiert das Sequenz-zu-Sequenz-Vorhersage-Netzwerk das Eingabemodell von Textmerkmalen, überlagert die vorhergesagten Werte in das MEL-Spektrum, und der Vokoder erzeugt eine Zeitdomänenwellenform basierend auf der vorhergesagten Sequenz. Für und Wider: Vorteile: Das Problem der Gradientenverschwendung wird durch die Verbesserung des Aufmerksamkeitsmechanismus optimiert, die Klangqualität der Sprachgenerierung ist gut und es ist gut robust für die Eingabedaten. Nachteile: Die Synthesegeschwindigkeit autoregressiver Modelle unter Verwendung der RNN -Struktur ist langsam, es ist schwierig, komplexe Wörter auszusprechen, der erzeugten Sprache fehlt die emotionale Farbe, und die Trainingszeit und die Kosten großer Datensätze sind hoch, und dem Modell fehlt die Kontrollebarkeit.
● Mainstream -Modelle:
Customisierte Nachfrageherausforderungen
3
Multimodal Fusion Challenge
2
1
Datenlücke Herausforderung
Personalisierte Sprachsynthese, professionelle Interaktionsfähigkeit, maßgeschneiderte Sprachingenieurwesensfähigkeit
Konvergenz der Wahrnehmungs-, kognitiven und synthetischen Technologien zur Anwendung von Produktkontrollierbarkeits- und Generalisierungsfunktionen
Training mit niedriger Ressourcen-Sprachsynthese, Textverbesserung, Konstruktion von synthetischen Daten und Niederschlagsvorschriften für Benutzerdaten
Sprachumwandlung Stilübertragungsanwendung: Film, Fernsehen, Animation, Spiele und andere Felder: Einstellung von Stimmen verschiedener Charaktere Szenarien, die Privatsphäre und Sicherheit beinhalten: Datenschutzverarbeitung von Sounds Synthetische Datenanwendung: Synthetischen Daten bilden und das Maßstab der Schulungsdaten erhöhen
Sprachverbesserung, Sprachreparatur Führen Sie Rauschreduzierung, Filterung, Verstärkung und andere Verarbeitung bei Sprachsignalen durch Anwendungsszenarien: Telefonaufzeichnung, Videokonferenzen, Sprachinteraktionsdienste in öffentlichen Umgebungen zur Verbesserung der Spracherkennungsfunktionen und der Qualität der Generation Anwendung historischer Audiodaten: Wiederherstellung historischer Audiodaten, spekulative Synthese der alten Sprachaussprache Wert der historischen Forschung: Es hat einen wichtigen Anwendungswert für die historische Forschung
Musikgenerierung Kohärente Musik mit semantischem und konsequentem Stil kann basierend auf dem aufgeforderten Audioclip oder Textbeschreibung generiert werden. Musik- und Film- und Fernsehfelder: Song -Arrangement, Musikstil -Verfeinerung, Hintergrundmusik und Umgebungsgeräuschgeneration usw.
Sprachinteraktion Dialog-Szenario-Anwendung des Mensch-Computers: In verschiedenen Arten von Dialogen von Mensch-Computer-Dialogen wird häufig verwendet Enterprise Services, Finanzen und andere Branchen: Intelligente Kundendienstroboter führen Sprach Q & A mit Kunden durch, um Arbeitskosten zu sparen Haushaltsgeräte, Automobile und andere Branchen: Smart Home, Smart Car -Szenarien, Sprachassistenten vollständige Benutzerbefehle Nachrichten- und Medienindustrien: Gleichzeitige Interpretationsarbeit in internationalen Konferenzen, Ausstellungen und anderen Aktivitäten
Phonetische Synthese Anwendungen im Bereich der Pan-Entertainment: langfristige Klangproduktionsszenen wie Nachrichtensendungen, Audio-Lesen und andere langfristige Soundproduktionsszenarien und industrielle Fertigung Anwendungen: Sprachnavigation, Verkehrsbefehl Industrielle Automatisierungssteuerung Anwendungen der Cross-Sprach-Synthese: Ausspracheübersetzung, Sprachlernen Anwendung im medizinischen Bereich: medizinische tragbare Geräte wie künstliche Hals
Spracherkennung Feature -Extraktion und Umwandlung von Eingabe -Audio in entsprechende Text oder Befehle, um die Textkonvertierung von Stimmaussagen oder verschiedene Audioinhalte zu realisieren Anwendung von C-End-Szenario: Spracheingangsmethode und mündliche Hinweise auf Smartphones Branchenanwendungsszenarien: Archivab Abruf, Elektronikeintrag, Film- und Fernsehsachenproduktion
Audio erzeugen
● Kontrolle der Sprachgeschwindigkeit, Rhythmus und Rhythmus ● Fähigkeit zur Text- und Ausspracheverständnis in unterschiedlichem Sprachhintergrund ● Erfassen Sie die Eigenschaften emotionaler Phoneme
Kontrolle Fähigkeit
Stimme Qualität
● hohe Genauigkeit ● Anti-Interferenz-Fähigkeit
erzeugen Geschwindigkeit
● Einzelne Benutzer: Kann die Erzeugungsgeschwindigkeit in Echtzeit auf Anforderungen reagieren? ● Enterprise -Benutzer: Die Auswirkungen der Erzeugungsgeschwindigkeit auf Geschäftsprozesse
● Aktuelle Mainstream -Audio -Synthesemethode ● Reduzieren Sie die Schwierigkeit, Linguistikkenntnisse auszubilden ● Der Klang ist natürlich und nähert sich der Wirkung der Stimme der realen Person
● Die erforderlichen Original -Schalldaten sind gering und sind reibungslos gelten ● viel Lärm ● schwerere Sprachmechanik
● Die Klangqualität basiert besser auf der Aufnahme der echten Person ● Verweilen Sie sich auf das Datenbankdatenvolumen der Sprachdatenbank ● Der Wortverbindungsübergang ist relativ steif
End-to-End-Synthesestadium
Parameter -Synthesestufe
Synthesestadium spleißen
Melodie erzeugen, Musik
Basierend auf visuellen Inhalten (Bild oder Video) Machen Sie eine Sprachbeschreibung
Text-to-Speech Synthese Aussprachen basierend auf Text synthetisieren
3
Vorschriftenregulierung und Datenschutzschutz Urheberrechtsschutz AI Governance
2
Produktisationsfähigkeit Aufforderung verstehen Verwendung von Feinabstimmungswerkzeugen
Datenfähigkeit Einschaltkreisgang von Datenvermögenswerten
1
Bild Super -Auflösung Medizinische Fälle und anatomische Strukturschöpfung Astronomische Beobachtung, Satellitenfernerfindung Martingale Farbmessung Messung
Bildreparatur Wiederherstellung des digitalen historischen Dokuments, Bildreparatur alte Fotos und alte Filmreparatur
Bildgenerierung, Bildstilkonvertierung Kunstkreation, Bildbearbeitung, Bildkünstler -Cartoon -Charaktere, Spielerproduktionsposter, Produktlogo und Verpackungsdesign
Bildklassifizierung, Bildsegmentierung Zielerkennung, Bildabruf -Industriedesign Analyse der Veränderungen der Annotation der medizinischen Bildgebung und der anatomischen pathologischen Struktur
3
4
2
1
Bildkontrollierbarkeit Bilddetailsteuerung Nachfolgende Anpassungen
Bilddiversität Detailausdruck und Stilausdruck Semantische Konsistenz mehrerer Bilder oder unterschiedlicher Stile
Bildstabilität Beschreiben Sie Daten für Verzerrungen, Verzerrungen und Ausnahmen Anti-Interferenz-Fähigkeit
Bildqualität Der Reichtum der Bildqualität und detaillierte Informationen Die Realität des Bildes
Einführung
Basierend auf dem potenziellen Diffusionsmodell -Framework kann die Rechenleistung und die Bereitstellungsschwellen reduziert werden, die speziell für literarische Grafikaufgaben verwendet werden.
Basierend auf dem Rahmen des Clip- und Diffusionsmodells kann die Erzeugung von Bildern eine gute semantische Konsistenz beibehalten
Ein multimodales Generationsmodell, das auf dem Diffusionsmodell -Framework basiert, schlägt ein Hybrid -Expertenmodell vor und wählen Sie automatisch das Netzwerk der optimalen Generation aus
Basierend auf dem Bildgenerierungsmodell nach feiner Anpassung des Diffusionsmodell
Ist es Open Source?
Github Open Source
Nicht Open Source
Nicht Open Source
Nicht Open Source
Mechanismus
Stabilität
Offen
Baidu
Midjourney
Modell
Stabile Diffusion
Dall-e2
Midjourney V5
Wenxin Ernie-vilg2.0
● Inländische und ausländische repräsentative Modelle:
Clip: kontrastives Sprachbild vor dem Training
Implementierungsprinzip: Das vorhandene Text-Image-Quermodal-Modell, das auf Kontrastlernen basiert, besteht darin, den Text und die Bilder durch einen Encoder zu extrahieren, den Text und die Bilder in denselben Repräsentationsraum zuzuordnen und das Modell durch die Ähnlichkeit und Differenzberechnung des Textbildpaars zu trainieren, so dass Bilder, die der Beschreibung entsprechen, basierend auf dem angegebenen Text erzeugt werden können. Für und Wider: Vorteile: Es müssen keine Daten im Voraus markiert werden, in der Bildtextklassifizierungsaufgabe von Null-Stichproben gut abschneiden, genauere Textbeschreibung und Bildstil, nicht wesentliche Details des Bildes ändern, ohne die Genauigkeit zu ändern und in Bezug auf die Vielfalt in generierten Bildern besser abzuschneiden. Nachteile: Es gibt Einschränkungen bei der Leistung komplexer und abstrakter Szenarien, und der Trainingseffekt hängt von groß angelegten Textbildern ab, um relativ große Datensätze und Schulungsressourcen zu konsumieren.
Implementierungsprinzip: Durch Definieren einer Markov -Kette eines Diffusionsschritts wird das Bild erzeugt, indem die Daten kontinuierlich hinzufügen, bis ein reines Gaußscher Rauschdaten erhalten wird und der umgekehrte Diffusionsprozess gelernt wird, und das Bild wird durch Reversendeverstärkung der umgekehrten Rauschen erzeugt. Das Diffusionsmodell stört die Verteilung in den Daten systematisch und stellt dann die Datenverteilung wieder her, wodurch der gesamte Prozess eine allmähliche Optimierungseigenschaft erscheint, um die Stabilität und Kontrolle des Modells zu gewährleisten. Für und Wider: Vorteile: genauer wiederherstellen reale Daten, stärkere Fähigkeit, Bilddetails und besseres realistisches Bild zu halten. Insbesondere bei Anwendungen wie Reparaturen von Bildvervollständigungen und molekularen Kartenerzeugung kann es gute Ergebnisse erzielen. Nachteile: Komplexe Berechnungsschritte, langsame Stichprobengeschwindigkeit und schwache Verallgemeinerungsfähigkeit zu Datentypen.
Diffusionsmodell
● Mainstream -Modelle:
Diffusionsmodellgenerierungsstadium
● Aktuelles Mainstream -Bildgenerierungsmodell ● Der Diffusionsprozess verbessert die Stabilität, Genauigkeit und Vielfalt signifikant In Kombination mit Clip kann es auf Aufgaben zur Erzeugung der bildmodalen Bildung angewendet werden ● Verbessern Sie die Geschwindigkeit und Qualität der generierten Bilder erheblich.
Autoregressionserzeugungsstadium
● Der auf der Transformatorstruktur basierende Selbstbekämpfungsmechanismus verbessert die Stabilität und Rationalität ● Probleme der Inferenzgeschwindigkeit und der Schulungskostenbegrenzungsanwendungen
● Bildgenerierungsmodell der Vorgängergeneration ● Verbesserung der Erzeugungs- und Identifizierungsfähigkeit durch Konfrontationstraining ● Schlechte Stabilität, mangelnde Vielfalt und Musterkollaps
Gan -Generationsphase
Wahre Farbbilderzeugung
RGB -Diagramm
Verwenden Sie die Kombination von RGB -Drei -Primärfarben, um den Farbwert jedes Pixels darzustellen, und speichern Sie ihn direkt in der Bildmatrix
Bilderzeugung mit relativ einfacher Farbzusammensetzung wie molekularen Karten
Konstruiert durch eine zweidimensionale Matrix und eine Farbindexmatrix-Karte, die das Bild speichert
Indexdiagramm
Bildgenerierung
Bild-zu-Image Generieren Sie neue Bilder aus vorhandenen Bildern
Bildkomposition Bildsynthese
Text-to-Image Generieren Sie semantische Bilder basierend auf der Textbeschreibung semantische Bilder
AIGC - Audiogeneration
AIGC - Videogenerierung
AIGC - Bildgenerierung
Definition
Definition
Definition
Die Audiogenerierung bezieht sich auf den Prozess der Synthese der entsprechenden Schallwellenformen basierend auf den Eingabedaten.
Die Videogenerierung bezieht sich auf das Training der künstlichen Intelligenz, mit der sie automatisch hochwertige Videoinhalte generieren können, die der Beschreibung entsprechen, basierend auf bestimmten einzelnen Modell- oder multimodalen Daten wie Text, Bildern, Videos usw.
Die Bildgenerierung bezieht sich auf den Prozess der Verwendung künstlicher Intelligenz-Technologie, um Bilder einzelner Modal oder Quermodal basierend auf bestimmten Daten zu generieren. Abhängig von den Aufgabenzielen und Eingabemodi enthält die Bilderzeugung hauptsächlich die Bildsynthese, die Erzeugung neuer Bilder basierend auf vorhandenen Bildern (Image-to-Image) und die Erzeugung semantischer Bilder basierend auf Textbeschreibungen (Text-to-Image).
Die Haupttypen und Anwendungsbereiche der Audiogenerierung
Die Haupttypen und Anwendungsbereiche der Videogenerierung
Haupttypen und Anwendungsfelder der Bildzusammensetzung
Typische Anwendungen
Natur
Datentyp
Natur
Datentyp
Bildtyp
Natur
Typische Anwendungen
Informationsübertragung, Interaktionsdienste für Mensch-Computer
Textinformationen extrahieren und Sprachinformationen synthetisieren
Textinformationen
Bearbeiten, synthetisieren und bearbeiten Sie mehrere Videos, um neue Videos zu generieren, einschließlich Video -Attributbearbeitung, Clip -Bearbeitung, Video -Teil -Bearbeitung usw.
Generation bearbeiten
Binärgrafik
Die zweidimensionale Matrix des Bildes besteht aus nur 0 (schwarz) und 1 (weiß), die als Binarisierung des Graustufendiagramms angesehen werden können.
Textextraktion, Bildfunktionsextraktion
Sprachbearbeitung, Sprachübersetzung, Musikproduktion
Basierend auf einem bestimmten Sprachsegment bearbeiten oder eine Sprache in die Sprachinformationen einer anderen Sprache konvertieren
Audioinformationen
Fügen Sie vorhandenen Videos wie Filter, Licht und Schatten, Feuerwerk usw. eine Vielzahl von Effekten hinzu, um die Kreativität und den künstlerischen Effekt des Videos zu verbessern
Spezialeffektgenerierung
Graustufen
Der Wertbereich der zweidimensionalen Matrixelemente beträgt normalerweise 0 (reines Schwarz) bis 255 (reines Weiß), und die mittlere Zahl repräsentiert die Übergangsfarbe zwischen Schwarz und Weiß.
Medizinisches Bild und Fernerkundung Bilderzeugung
Medizinische tragbare Geräte
Muskelbewegungen wie Hals und Gesicht wahrnehmen und die Stimme synthetisieren
Muskelschwingung
Inhaltsgenerierung
Generieren Sie entsprechende Videoinhalte basierend auf dem angegebenen Text, Bildern und anderen Informationen
Identifizieren und verstehen visuelle Inhalte wie Bilder und Videos und generieren Sie Sprachinformationen, die der Lippenform entsprechen
Digitale Menschen
Visueller Inhalt
Schlüsselphasen der technologischen Entwicklung der Bildzusammensetzung
Schlüsselphasen der technologischen Entwicklung der Audiogenerierung
Schlüsselphasen der technologischen Entwicklung der Videogenerierung
Prinzipien der Implementierung und Vor- und Nachteile des Mainstream -Modells
Herausforderung der Bildungserzeugung Kommerzialisierung Implementierung
Schlüsselfaktoren, die die Anwendungsfunktionen von Modellen beeinflussen
Typische industrielle Anwendungsszenarien für die Bildgenerierung
Anwendungen der Mainstream -Audiogenerierung
Modell
Einführung
Organisation
Ist es Open Source?
Tacotron2
Erstens schlägt es ein End-to-End-Sprachsynthesemodell als Infrastruktur mehrerer Sprachsystemlösungen vor
Bereits offen auf Github
Automatisches Spracherkennungsmodell zur Verbesserung der Spracherkennungsfunktionen durch große und diversifizierte Datensätze und unterstützt Sprachtranskription, Sprachübersetzung usw.
Bereits offen auf Github
Offen
Flüstern
Vollfaltes Modell für Sprachsynthese für die Fischung zu Sequence zu Sequence kann durch Erweiterung des Datensatzes für Sprachsynthese-Modelltrainingsmodellverbesserung verbessert werden.
Nicht Open Source
Baidu
Deepvoice3
Chinesisches Sprachmodell für industrielles chinesisches Sprachmodell, unterstützt multimodale Spracherkennung, emotionale Anerkennung, Anerkennung von Sprachabdrücken und andere Aufgaben
Nicht Open Source
Iflytek
Smart-TTs
Schlüsselfaktoren, die die Anwendungsfunktionen von Modellen beeinflussen
Schlüsselfaktoren, die die Anwendungsfunktionen von Modellen beeinflussen
Die Herausforderung der Kommerzialisierung der Audiogenerierung
Typische industrielle Anwendungsszenarien für die Audiogenerierung
Typische industrielle Anwendungsszenarien für die Videogenerierung
Herausforderung für die Kommerzialisierung der Videogenerierung
Chip -Design
Nahrung und Landwirtschaft
Energie
Materialwissenschaft
Persönliche Fürsorge
Die Technologie für künstliche Intelligenz entwickelt sich rasant, und neue Technologien können vorhandene Technologien ersetzen und so den kommerziellen Wert bestehender Technologien beeinflussen.
Technologieentwicklungswettbewerb
● Die Entwicklung von Arzneimitteln erfordert eine strenge Zulassung ● Urheberrechtsprobleme für integriertes Schaltungsdesign ● Molekulare Entdeckungsmodelle können verwendet werden, um verbotene Arzneimittel und gefährliche Produkte zu entwickeln
Gesetz Mit Sicherheit
Entwicklung und Überprüfungskosten
Drogendesign
Anwendbarkeit
Qualität erzeugen
Schlüssel Faktor
Die Modelle für molekulare Entdeckungen und integrierte Schaltungskonstruktionen müssen für bestimmte Konstruktionszwecke geeignet sein. Das integrierte Schaltungsdesignmodell muss auch das Modell erneut übertragen, die Architektur ändern, Parameter manuell anpassen, Entdeckungsprinzipien usw. in Kombination mit den industriellen Designzwecken für die industriellen Anforderungen angewendet werden.
Bei Modellen zur molekularen Entdeckung und integrierten Schaltungskonstruktionen ist die Qualität der Erzeugung der Kernfaktor, der seine Anwendungsfunktionen bestimmt.
Verdrahtung
Jobtyp
Jobziele
Repräsentatives Modell
Grundlegende Algorithmen und Modelle
Traumplatz
Parameteroptimierung des neuronalen Netzwerks
Layout -Optimierung des maschinellen Lernens
Grafik Neurales Netzwerk
PL-GNN
Grafik Neurales Netzwerk
Verstärkungslernen
Vollständiger Faltungsnetzwerk
Faltungsnetzwerk
Faltungsnetzwerk
Multi-Layer-Erfassungsmaschine
... ...
Faltungsnetzwerk
Variations -Autocoder
Monte Carlo Tree Search
RL für CF2
Deepplace
Künstliche Intelligenz -Layoutentscheidung
CNN für RDP3
FCN für RDP4
Betrachten Sie Layoutentscheidungen für die Verkabelung
ML für RDPE
Dlroute
Künstliche Intelligenzverkabelung Optimierung
... ...
Deeppr
VAE für CR6
MCTs für CR5
Künstliche Intelligenzverkabelungsentscheidung
Layout
Komplettes Layout- und Verkabelungsdesign
Kabellayout
Anwendungsszenarien für molekulare Entdeckungen und Schaltungsdesign
Kombinationsoptimierungsmethode
Methode der tiefen Generation
Markov -Kette Monte Carlo
MIMOSE
Zweidimensional
MARS
Zweidimensional
Konfgf
Dreidimensional
Diffusionsmodell
Dreidimensional
EVFN
Eindimensional
ORGEL
Zweidimensional
Eindimensional
Zweidimensional
Dreidimensional
Dreidimensional
MOIDQNMOIDON
Verstärkungslernen
GB-Ga
Gesteinigt
Genetischer Algorithmus
Bokei
BOA
Bayes'sche Optimierung
Defaktor
Eindimensional
Generieren Sie kontrovers Netzwerke
Zweidimensional
ORGEL
GraphNVP
Zweidimensional
Standardisierter Fluss
Zweidimensional
Moflow
Sg-vae
Eindimensional
Variations -Autocoder
Zweidimensional
CGVAE
Sf-rnn
Eindimensional
Zweidimensional
MolekularRnn
Autoregressives Modell
Eine Darstellung erzeugen
Repräsentatives Modell
Verwendete Algorithmen und Modelle
Methode erzeugen
Prinzip
Jobtyp
Bei einer Reihe von integrierten Schaltungskomponenten, einschließlich Standardeinheiten, Makromodulen, Logikgoren usw. sowie charakteristische Informationen wie Breite und Höhe dieser Komponenten, Es ist auch notwendig, Informationen über die Verbindungsbeziehung zwischen den PIN -Positionen dieser Komponenten und den Komponenten zu geben und die physischen Positionen der Komponenten basierend auf den obigen Informationen zuzuordnen, damit sich die Komponenten nicht überlappen.
Layout
Verdrahtung
Nach Abschluss des Layouts wurde die Pinposition der Komponente ermittelt, und die Verbindungsbeziehung zwischen den Komponenten wurde ebenfalls in dem während des Layout reservierten Kabelbereichs ermittelt. Entsprechend der Verbindungsbeziehung zwischen Komponenten und Anforderungen wie der minimalen Gesamtverkabelungslänge und der Zeitverkleidung zwischen Komponenten wird der Verbindungskreis zwischen den Komponenten ohne Verstoß gegen die Verdrahtungsregeln ausgelegt.
Normalerweise schriftlicher Textinhalt, der sachlich, funktional oder unterhaltsam ist
Dreidimensionale Darstellung
AIGC - Molekulare Entdeckung und Schaltungsdesign
Definition
Molekulare Entdeckung und Schaltungsdesign beziehen sich auf die Verwendung maschineller Lernen, tiefes neuronales Netzwerk und anderen Technologien, um die Struktur, Regeln und Eigenschaften von Molekülen und integrierten Schaltungen zu erlernen und Moleküle und integrierte Schaltungen mit ähnlichen Strukturen zu erzeugen, entsprechen spezifischen Regeln und haben Zieleigenschaften.
Haupttypen und Anwendungsfelder der molekularen Entdeckung und des Schaltungsdesigns
Ausdrucksmethode
Prinzip
Eindimensionale Darstellung
Moleküle als Saiten ausdrücken, um die Atome und Strukturen von Molekülen in Zeichen auszudrücken
Zweidimensionale Darstellung
Express Moleküle als Diagrammdaten, bei denen Atome und Bindungen als Punkte bzw. Kanten von Graphendaten dargestellt werden
Mainstream -Modell der molekularen Entdeckung
Modell des Mainstream -Schaltungsmodells
Schlüsselfaktoren, die die Anwendungsfunktionen von Modellen beeinflussen
Risiken der Kommerzialisierung der molekularen Entdeckung und des Schaltungsdesigns
● Die Entwicklung erfordert viele Daten und Talentkosten ● Der Überprüfungsprozess erfordert viel Unsicherheit und hat einen langen Zyklus
03 Technologie- und Anwendungssubstitutionsrisiken
02 Informationssicherheitsrisiken
01 Fehlermeldung Schädliche Informationen
E-Commerce-Industrie
Nachrichten und Medien
Bildungsbranche
● Produktbeschreibung generieren ● Produktbewertungen analysieren ● Produktempfehlungen generieren ● Generieren Sie einen Analysebericht
● Nachrichtenberichte generieren ● Führen Sie die Erstellung von Inhalten durch ● Generieren Sie Hosting Oral Sendung ● Anzeigendokument erstellen
● Unterrichtsplan erstellen ● Unterrichtsplan erstellen ● Unterstützung bei der Korrektur von Hausaufgaben ● Bereitstellung von Studienunterricht zur Verfügung
Produktspanne
● Unterstützung bei der Entwicklung von IT -Produkten ● Testfälle generieren ● Produkthandbuch erzeugen ● Betriebsschritte erzeugen
Kundendienstbranche
● Generieren Sie eine Lösung ● Intelligente Kundendienstlösung ● Kundenabsichten verstehen ● Exklusiver Kundendienst für große Kunden
Marketing
● Generieren Sie ein Angebot ● Erstellen Sie einen Verkaufsplan ● Marktdaten analysieren ● Verkaufsdaten analysieren
Medizinische Industrie
● Helfen Sie Ärzten beim Schreiben von medizinischen Plänen ● Helfen Sie Ärzten beim Schreiben von medizinischen Unterlagen ● Patienten helfen, medizinische Ressourcen zu entsprechen ● Bereitstellung von Diagnose- und Behandlungsanleitungen für Patienten
● Analysieren Sie eine große Anzahl von Finanzberichten ● Generieren Sie eine Zusammenfassung der wichtigsten Informationen ● Beratung für Anlagestrategie geben ● Generieren Sie einen Datenanalysebericht
Finanzindustrie
Anpassungs- und Innovationsfähigkeiten
Differenzierte Kundenbedürfnisse erfüllen Auf Marktveränderungen mit Innovation reagieren
Produktbetrieb und Kundendienstunterstützung
Erhöhen Sie die Klebrigkeit der Benutzer und erhöhen Sie die Migrationskosten Benutzerkonvertierung und -aufbewahrung erkennen
Marketingfähigkeiten
Wirksame Kostenverdünnung Gewinnspanne sicherstellen
Erweiterte Modellwissensdomäne Entdecken Sie Anwendungsschmerzpunkte und Anwendungsanforderungen
Qualität erzeugen
Tongyi Qian Fragen
Wen Xins Worte
diskutieren
Alibaba Cloud
Baidu Smart Cloud
Shang Tang
China
China
China
Benchmarking gegen Chatgpts chinesische universelle Sprachgenerierungsanwendung, Zugriff auf Anwendungen wie Baidu -Suchmaschinen, Baidu -Bibliothek, Xiaodu Smart Assistant usw., die Zusammenarbeit mit vielen Unternehmen und Institutionen erreicht, um die Anwendungsszenarien der Sprachgenerierung zu erkunden
Ja
NEIN
NEIN
Benchmarking der chinesischen Anwendung der gemeinsamen Sprachgenerierung von ChatGPT und unterstützte maßgeschneiderte Modelle von Unternehmen
Benchmarking gegen Chatgpts chinesische universelle Sprachgenerierungsanwendung und die Anwendung der vertikalen Sprachgenerierung für medizinische und Programmierszenarien werden gestartet
Claude
Benchmarkieren Sie die Anwendung der gemeinsamen Sprachgenerierung von ChatGPT, optimieren
Anthropisch
Übersee-
Ja
Online geöffnet
Ja
Ja
Markt
Übersee-
Übersee-
Organisation
Offen
2022-to-Datum: Bewerbungsbeschleunigungsperiode ● Die Erzeugung der Sprachqualität steht im Einklang mit menschlicher Ebene ● Branchenunternehmen untersuchen aktiv die Anwendungsszenarien und Anwendungsmethoden der Sprachgenerierung in verschiedenen Branchen und Bereichen
Ⅵ
Ⅴ
F
E
Ⅳ
2020-2021: Anwendungsforschungszeitraum ● Die Fähigkeit zur Sprachgenerierung erfüllt die grundlegenden Anwendungsanforderungen ● Branchenunternehmen untersuchen zunächst Anwendungsszenarien für Aufgaben zur Erzeugung von modaler Sprache
2018-2019: Model Exploration Periode ● Das Modell der Sprachgenerierung hat ein klares Paradigma ● Legen Sie die technische Grundlage für Anwendungen für die Erzeugung mit geringer modaler Sprache
D
Ⅲ
C
Ⅱ
B
Ⅰ
2017: Technologieentwicklungsperiode ● Schlagen Sie Transformator Architecture, Yingding Technology Foundation vor ● Es können nur hoch gemusterte Aufgaben zur Erzeugung der Spracherzeugung erledigt werden
Vor 2017 ● Schwache Fähigkeit zur Sprachgenerierung ● Die Anwendung kann nur hoch gemusterte Sprachgenerierungsaufgaben erledigen
Schnelle Entwicklungsperiode
Marktstartzeit
Explorationszeit
A
Anwendungen der Mainstream -Sprachgenerierung
Einführung
Anwendungsname
Benchmark Universal Language Generation Application, die besten Ergebnisse bei Aufgaben mehrerer Sprachengenerierung wie Textgenerierung, Textübersicht, Textänderung, Interaktion mit natürlicher Sprache, Codegenerierung usw. und Zusammenarbeit mit vielen führenden Unternehmen und Institutionen, um die Anwendungsszenarien der Sprachgenerierung zu untersuchen
Chatgpt
Benchmarking Die Anwendung der universellen Sprachgenerierung von ChatGPT, Zugriff auf die Google -Suchmaschine, um die Sucherfahrung zu optimieren und auf Google Office -Produkt -Ökosystem zugreifen zu können
BARDE
Interaktion bereitstellen
Inhalte generieren
Normalerweise schriftlicher Textinhalt, der sachlich, funktional oder unterhaltsam ist
Blog -Artikel, Nachrichten, E -Mails, Romane, Codes
Generieren Sie einen festen Formatvertrag usw.
Es kann bei der Erstellung von literarischen Inhalten beitragen und verschiedene Inhalte zusammenfassen.
AIGC - Sprachgenerierung
Definition
Die Sprachgenerierung bezieht sich auf das semantische Wahrscheinlichkeitsmodell, das neuronale Netze gelernt haben, die Sprachen entsprechend den Aufgabenanforderungen generieren können, und die generierten Sprachen umfassen natürliche Sprache, Programmiersprache und logische Sprache usw.
Die Haupttypen und Anwendungsbereiche der Sprachgenerierung
Datentyp
Natur
Typische Anwendungen
Gemeinsame Sprache erzeugen
Verfügen über viele gemeinsame Domänenkenntnisse und kann verschiedene Arten von Aufgaben der Sprachgenerierung entsprechend den Anforderungen erledigen
Voxelgitter, Punktwolke und Maschen
Vertikale Sprachgenerierung
Zusätzlich zu einem gewöhnlichen Domänenkenntnis gibt es auch professionelle Domänenkenntnisse.
Finanzbericht Schreiben und Analyse usw.
Schlüsselphasen der technologischen Entwicklung in der Sprachgenerierung
Schlüsselfunktionen für die Kommerzialisierung von Anwendungen zur Sprachgenerierung
Typische industrielle Anwendungsszenarien für die Sprachgenerierung
Risiko einer Vermarktung der Sprachgenerierung
Aufgrund der grundlegenden Natur der Semantik können alle Arten von Anwendungen aus der semantischen Ebene entkoppelt und dekonstruiert werden.
Beim Generieren von Anwendungen mit Sprachen, da viele Produkte und Dienste auf öffentlichen Cloud -Diensten basieren oder Informationen auf den Anbieterserver hochladen müssen, kann das Risiko von Informationsleckagen auftreten.
Das Erzeugen von Fehlinformationen und schädlichen Informationen kann einen enormen Einfluss auf den Ruf und das Produkt im Rahmen von Marken haben und daher zu einem enormen Risiko für die Kommerzialisierung von Anwendungen der Sprachgenerierung werden.
Technologische Innovationsprobleme
Challenge für Szenarioanwendungen Implementierung
Copyright Challenge
Gegenwärtig werden viele Anwendungsszenarien, die die Möglichkeit haben, durch die dreidimensionale Erzeugung der künstlichen Intelligenz kommerzialisiert zu werden, wie z. B. Filmproduktion, Produktkonzeptdesign, dreidimensionale Vermögensproduktion usw., von Benutzern in tatsächlichen Anwendungen immer noch akzeptiert. Der Grund, warum die dreidimensionale Erzeugung in dieser Art von Anwendungsszenario weiterhin verwendet wird, ist, dass es notwendig ist, die Einheit des Bildinhalts aus verschiedenen Perspektiven zu gewährleisten, sodass die dreidimensionale Generation in diesen Szenarien immer noch einen einzigartigen Anwendungswert hat.
Gegenwärtig erfordern viele dreidimensionale Generierungsanwendungen für künstliche Intelligenz noch eine große Menge an Textdaten und zweidimensionale Bilddaten als Grundlage für Trainingsmodelle. Wenn diese Daten aus urheberrechtlich geschützten Vermögenswerten stammen, ist die Verwendung dieser Daten zur Kommerzialisierung anfällig für Urheberrechtsfragen.
03
02
01
Die Anwendungsszenarien der dreidimensionalen Erzeugung können grob in Szenarien für Fachleute und Szenarien für gewöhnliche Verbraucher unterteilt werden. Szenarien für Fachleute erfordern die Fähigkeit künstlicher Intelligenz, die Anwendungsanforderungen auf industrielle Linienebene wie hochwertige Generation und hohe Kontrollierbarkeit zu erfüllen. Anwendungsszenarien für gewöhnliche Verbraucher haben jedoch relativ geringe Anforderungen an die Qualität und Kontrolle der dreidimensionalen Erzeugung künstlicher Intelligenz, die Anwendungen für normale Verbraucher haben jedoch im Allgemeinen hohe Anforderungen an die Erzeugungseffizienz.
Herausforderungen für die Kommerzialisierung der 3D -Generation
Virtuelle Realität
Bildungsausbildung
Verwenden Sie die 3D -Generationstechnologie, um realistische virtuelle Welten und Charaktere zu schaffen, um den Realismus und den Eintauchen der virtuellen Realität zu verbessern.
Lehrer und Schüler nutzen die dreidimensionale Generationstechnologie, um komplexes wissenschaftliches und technisches Wissen besser zu verstehen und zu lernen und die Effektivität und Lerneffizienz der Lehre zu verbessern.
Film- und Animationsproduktion
Kunstdesign
Verwenden Sie die 3D -Generationstechnologie, um realistische 3D -Szenen und -charaktere zu erstellen und komplexe visuelle Effekte zu erzielen, um die Qualität und das Betrachten von Filmen und Animationen zu verbessern.
Verwenden Sie die dreidimensionale Generationstechnologie, um digitale Kunstwerke, digitale Skulpturen und andere kreative Arbeiten zu erstellen, um die Effizienz und Ausdruckskraft der Schöpfung zu verbessern.
Architektonisches Design
Gesundheitspflege
Verwenden Sie die 3D -Generationstechnologie, um Architekturmodelle und visuelle Renderings schneller zu erstellen und die Designeffizienz und -genauigkeit zu verbessern.
Verwenden Sie die dreidimensionale Generationstechnologie, um realistische menschliche Organmodelle und medizinische Geräte für Gebiete wie medizinische Ausbildung, chirurgische Simulation und Diagnose der Krankheiten zu erstellen.
Industrielle Fertigung
Verwenden Sie die 3D -Generationstechnologie, um Teile und Formen schneller zu erstellen, die Produktionseffizienz und -genauigkeit zu verbessern und die Produktionskosten zu senken.
Verwenden Sie die 3D -Generationstechnologie, um schnell realistische 3D -Szenen und virtuelle Charaktere zu erstellen, um den Realismus und den Eintauchen des Spiels zu verbessern.
Spielentwicklung
Typische industrielle Anwendungsszenarien für die dreidimensionale Erzeugung
Kontrollierbarkeit
Verständnis des Unterrichts stärken Die Modellierungsarbeiten sind von der Rendering -Arbeit getrennt, und der Gitterexpression ist erforderlich
Erzeugungseffizienz
Große Berechnungen und langsame Geschwindigkeitsgeschwindigkeit Die Schulungserzeugung erfordert hohe Hardwareanforderungen
Modellfinanz und Genauigkeit Auflösung von Rendern, Genauigkeit Materialausdruckgenauigkeit
Qualität erzeugen
Schlüsselfaktoren, die die Anwendungsfunktionen von Modellen beeinflussen
Magic3d Modell
Implementierungsprinzip: Zunächst wird ein einfaches, einfaches Rendering-Hash-Grid-3D-Modell mit geringer Auflösung verwendet, um eine niedrige Auflösung, ein einfaches Rendering des Hash-Grid-3D-Modells zu erzeugen, und dann eine höhere Qualitätswiedergabe des 3D-Modells, um eine Methode zu verwenden, die einer ähnlichen Methode wie herkömmliche Computergrafiken ähnelt. Für und Wider: Vorteile: Das dreidimensionale Modell, das von Magic3D-Modellen erzeugt wurde, hat eine höhere Auflösung, einen besseren Rendering-Effekt und eine erhebliche Verbesserung der Erzeugungseffizienz. Nachteile: Das Magic3D -Modell hat eine hohe Nachfrage nach Rechenressourcen, lange Modelltrainingszeit, große Auswirkungen auf die Textbeschreibung und eine starke Abhängigkeit von spezifischem Domänenwissen.
Dreamfusionsmodell
Implementierungsprinzip: Es basiert hauptsächlich auf der Diffusionsmodell-Technologie im Deep Learning und kombiniert die Konzepte von Neuralstrahlungsfeldern (NERF) und Text-Image-Diffusionsmodell. Für und Wider: Vorteile: Es kann qualitativ hochwertige und realistische 3D-Modelle aus Textbeschreibungen erzeugen und die Erzeugung und Optimierung der Mehrwinkel unterstützt, wodurch die Kohärenz und Realität von 3D-Szenen verbessert wird. Nachteile: Es hat eine hohe Abhängigkeit von Hardware -Ressourcen, und die Verallgemeinerungsfähigkeit des Modells muss verbessert werden.
Clip-nernf-Modell
Implementierungsprinzip: Das Clip (kontrastive Sprach-Image-Pre-Training) -Modell wird in die Bearbeitung von NERF (Neural Radiance Fields) eingeführt, um text- oder bildgesteuerte NERF-Änderungen zu implementieren. Für und Wider: Vorteile: Das Clip-Nerf-Modell achtet mehr darauf, das erzeugte dreidimensionale Modell und die dreidimensionalen Rendering-Effekte in natürlicher Sprache oder zweidimensionale Diagramme anzupassen. Nachteile: In Bezug auf den Erzeugungseffekt und den kommerziellen Wert hat das Clip-Nerf-Modell die gleichen Probleme wie das Traumfeldmodell.
Implementierungsprinzip: Mit Clips Fähigkeit, vom Text zu zweidimensionalen Bildern zu erzeugen, kombiniert mit Nerfs Fähigkeit, dreidimensionale Strukturen und Texturwiedergabe aus zweidimensionalen Bildern zu lernen, können wir die Erzeugung von natürlicher Sprache bis dreidimensional erreichen. Für und Wider: Vorteile: Das Modell der Traumfelder beweist, dass das Clip-Modell in Kombination mit dem NERF-Modell angewendet werden kann und die Vorstellungsbeschränkungen früherer dreidimensionaler Generativmodelle durchbricht. Nachteile: Die Struktur des dreidimensionalen Inhalts, das vom Dream Fields-Modell erzeugt wird, ist immer noch relativ einfach, und der dreidimensionale Rendering-Effekt ist schlecht, sodass groß angelegte dreidimensionale Szenen nicht erzeugt werden können. Darüber hinaus ist die Erzeugungseffizienz des Dream Fields-Modells sehr niedrig und hat eine schlechte Verbindung mit der traditionellen dreidimensionalen Arbeitenarbeit, sodass es keinen kommerziellen Wert hat.
Dream Fields Model
● Mainstream -Modelle:
Prinzipien der Implementierung und Vor- und Nachteile des Mainstream -Modells
Zweidimensionale Dimensionsverbesserung der Anwendungsforschungszeit 2022 zu Datum
● Die zweidimensionale Erzeugung entwickelt sich schnell ● Die zweidimensionale Dimensions-Upgrade-Route ist klar ● Gan hat noch Anwendungen
Die Entwicklungszeit der zweidimensionalen Dimensionsverbesserungstechnologie 2020-2022
● Schlagen Sie ein neuronales Strahlungsfeld vor ● Dimensional Upgrade -Forschungsbeschleunigungen beschleunigen ● Gan wird zum Mainstream von dreidimensional
Zweidimensionale dimensionale Keimungsperiode 2018-2020
● Schlagen Sie die dreidimensionale Expression des Nervenfeldes vor ● Dimensionale Verbesserungsforschung entwickelt sich langsam ● Es gibt viele native dreidimensionale Forschungsergebnisse
Die wichtigste Phase der technologischen Entwicklung bei dreidimensionaler Erzeugung
Typische Anwendungen
Voxelgitter, Punktwolke und Maschen
Dreidimensionaler Szenenrekonstruktion und Rendering
Natur
Die Form, Struktur und Position von dreidimensionalen Objekten in intuitiver Form ausdrücken
Eine dreidimensionale Szene, die in neuronalen Netzwerkparametern ausgedrückt wird, nämlich ein neuronales Feld
Implizite Expressionsdaten
Dominante Expressionsdaten
Datentyp
Die Haupttypen und Anwendungsbereiche der 3D -Generation
Die dreidimensionale Generation (künstliche Intelligenz) bezieht sich auf die Verwendung von tiefen neuronalen Netzwerken, um dreidimensionale Modelle von Objekten oder Szenen zu lernen und zu generieren, und macht das Erzeugungsergebnis das Erzeugungsergebnis realistischer. In Anwendungen wird die Erzeugung eines dreidimensionalen Modells eines Objekts oder einer Szene als dreidimensionale Modellierung bezeichnet, und die Farbe und das Licht und der Schatten eines dreidimensionalen Modells werden als dreidimensionale Rendering bezeichnet.
Definition
AIGC - 3D -Generation