Galerie de cartes mentales Gestion intelligente des médias Alibaba Cloud
Intelligent Media Management IMM (Intelligent Media Management) est un outil d'analyse et de gestion intelligent basé sur des scénarios pour les données encapsulées. Fournit un guichet unique de traitement, d'analyse, de récupération et d'autres expériences de gestion et de contrôle des données pour les documents et les données d'image sur le cloud. Selon différents scénarios d'application tels que l'analyse d'images et le stockage de données, des capacités de traitement complètes sont encapsulées et intégrées pour permettre un flux de données rapide.
Modifié à 2024-01-13 15:37:11Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Gestion intelligente des médias Alibaba Cloud
Présentation du produit
La gestion intelligente des médias encapsule et intègre des capacités de traitement complètes pour les scénarios commerciaux dans différents secteurs, fournissant la conversion et la prévisualisation du format de document, la reconnaissance du contenu de l'image, la détection des visages, la détection du code QR, la recherche de visage et d'autres fonctions. Elle convient à la gestion des actifs multimédias, à l'utilisation intelligente. par les développeurs de disques réseau, d'applications sociales, de photothèques, etc. La gestion intelligente des médias peut combiner le stockage d'objets (OSS) et le stockage de tables (Tablestore) pour fournir des solutions pratiques à guichet unique basées sur des scénarios pour la gestion de documents, l'analyse sociale des images et d'autres domaines.
Caractéristiques
Conversion et aperçu de documents
Intégrez la conversion et la prévisualisation des formats liés aux documents pour bénéficier rapidement de fonctionnalités de gestion intelligente des documents.
Fonction illustrer conversion de format Convertissez 48 formats de documents tels que PPTX, PPT, XLS, DOC, PDF, HTML, HTM en formats vectoriels JPG, PNG, PDF, TXT et VECTOR. Pour plus d’informations, consultez Conversion du format de document. Aperçu du document Choisissez une méthode appropriée pour prévisualiser le document en fonction des besoins réels. Document Preview V1 : après avoir converti le document d'entrée au format vectoriel VECTOR, il peut obtenir un effet de prévisualisation de document plus facile à utiliser, plus puissant et personnalisé en s'arrimant au moteur de rendu frontal fourni par la gestion intelligente des médias. Pour plus d’informations, consultez Aperçu du document V1. Aperçu du document V2 : après avoir obtenu l'adresse d'aperçu et le AccessToken du document, il n'est pas nécessaire de spécifier l'élément iframe. Le fichier JS générera automatiquement une iframe sous l'élément de bloc personnalisé, et l'AccessToken peut être défini via le fichier JS pour. prévisualisez rapidement le document. Voir Aperçu du document V2 pour plus d'informations.
Détection intelligente d'image
Intégrez des fonctions d'IA telles que la reconnaissance de contenu et la détection de visage pour réaliser rapidement une gestion intelligente des images.
Fonction illustrer identification du contenu Identifiez les scènes, les objets, les événements et autres informations dans les images et obtenez les informations de métadonnées des balises. Pour plus d’informations, consultez Sensibilisation au contenu. Détection facial Détectez le visage sur la photo ainsi que l'âge, le sexe, l'humeur, etc. de la personne, et obtenez les métadonnées du visage. Pour plus d'informations, voir Détection de visage. Détection de code QR Détectez le code QR dans l'image et le contenu stocké dans le code QR. Pour plus de détails, voir Reconnaissance du code QR. Détection humaine Détectez les régions du corps humain dans les images en toute confiance. Pour plus d’informations, consultez Détection humaine. Recherche de visage Recherchez les N images les plus similaires à l’image spécifiée et les résultats sont triés par ordre décroissant de similarité. Pour plus d’informations, consultez Recherche de visage. Comparaison des visages Comparez la similitude des deux plus grands visages des deux images. Pour plus d’informations, consultez Comparaison de visages. Filigrane aveugle d’image Ajoutez un filigrane aveugle de type image ou texte à l’image. Une fois le filigrane aveugle ajouté, le filigrane ne peut pas être vu directement dans l'image, mais le filigrane caché dans l'image peut être restauré en utilisant la fonction d'analyse du filigrane aveugle d'image de la gestion intelligente des médias. Pour plus d’informations, consultez Filigrane d’image aveugle.
Avantages du produit
Analyse des points douloureux du scénario
Application photo
Pour les applications d'images, téléchargez d'abord des images et des vidéos sur le stockage d'objets. Avec le développement continu des affaires et les besoins réglementaires des lois et politiques, des fonctions d'analyse d'IA telles que la détection pornographique, la détection d'étiquettes, la détection de visage et la reconnaissance OCR seront ajoutées. montré dans la figure ci-dessous.
Habituellement, les applications d'image choisissent d'utiliser des serveurs d'entreprise pour installer des capacités d'analyse d'IA de différents fabricants. Grâce à ces fonctions, des informations de métadonnées clés peuvent être obtenues puis enregistrées dans la base de données, prenant ainsi mieux en charge la récupération des métadonnées et répondant aux besoins commerciaux et réglementaires. Il y a les problèmes suivants avec cette solution :
L'interface n'est pas unifiée
Comme il existe plusieurs fabricants parmi lesquels choisir, la compatibilité des interfaces des différents fabricants doit être prise en compte.
Gaspillage de ressources
La même image sera lue plusieurs fois ou même transmise au réseau externe, ce qui gaspille la bande passante du réseau.
Solution de traitement par lots à faible coût sans données existantes
L'utilisation du traitement synchrone du fabricant est coûteuse, et il est nécessaire de fournir une solution de traitement par lots à faible coût pour les données existantes et d'accepter des interfaces asynchrones pour renvoyer les résultats de détection. Par exemple, effectuez un traitement de marquage sur toutes les images du compartiment OSS existant.
disque net
Pour les applications de disque réseau, des fonctions telles que la connexion utilisateur, les services d'annuaire, la transmission directe de données vers OSS et le traitement intelligent de l'IA sont généralement requises. En utilisant le serveur et la base de données via le backend, l'architecture est illustrée dans la figure ci-dessous.
Afin de prendre en charge la gestion des données des disques réseau, il est généralement nécessaire de fournir différents types de gestion des métadonnées. En particulier dans les scénarios de traitement intelligent de l'IA, il est nécessaire de définir des formats de stockage pertinents et de gérer les exceptions de base de données, ce qui entraîne une plus grande difficulté de développement. Il y a les problèmes suivants avec cette solution :
La conception des tables de métadonnées est difficile
Pour différentes métadonnées, différents types de stockage de structure de table doivent être classés et conçus, et il existe des seuils techniques.
La gestion des métadonnées multidimensionnelles est un défi
Il est nécessaire de combiner plusieurs métadonnées pour le traitement des requêtes associées, ce qui présente des défis de conception.
Défis liés au maintien de la cohérence des métadonnées
La résolution du processus de récupération des métadonnées dans des scénarios anormaux est un problème au niveau du système.
Avantages du produit de gestion intelligente des médias
La gestion intelligente des médias est conçue autour de six points clés : données massives, connectivité de bout en bout, normes unifiées, analyse intelligente, combinaison de scènes et traitement en un clic, et fournit des solutions de traitement intelligent d'IA basées sur des scénarios, comme le montre la figure. ci-dessous.
Grâce à une conception d'architecture ciblée, la gestion intelligente des médias présente les avantages suivants :
Stockez les données en toute transparence
Directement lié au stockage objet OSS pour traiter automatiquement les données sur le cloud.
Traitement de données riches
Combiné aux capacités avancées de reconnaissance et de traitement du secteur, il offre un support fonctionnel riche pour le traitement des applications.
Simplifier l'exploitation et la maintenance
Fournissez des services sans serveur sans avoir à vous soucier du fonctionnement et de la maintenance de votre entreprise.
Solution unique basée sur des scénarios
Construisez une gestion rapide des métadonnées pour les scénarios et implémentez rapidement des applications.
architecture du produit
La gestion intelligente des médias est conçue à l'aide d'une architecture en couches. L'architecture en couches comprend trois couches : le moteur de traitement, la gestion des métadonnées et l'encapsulation basée sur des scénarios, et il existe des contextes dépendants, comme le montre la figure ci-dessous.
Il s'appuie sur les services de stockage Alibaba Cloud tels que le stockage d'objets et le stockage de fichiers pour accéder aux données non structurées (telles que des images et des vidéos) dans le stockage Alibaba Cloud via un mécanisme sécurisé et extraire des informations précieuses.
Il est encapsulé sur la base de la compréhension de la scène pour prendre en charge des scénarios d'applications d'images et de vidéos tels que les disques réseau, les albums photo cloud, les galeries sociales et la surveillance domestique, offrant ainsi une nouvelle valeur aux applications.
couche du moteur de traitement
Alibaba Cloud Storage fournit un cadre informatique à proximité qui prend en charge le traitement asynchrone par lots et le traitement synchrone en temps quasi réel après une association en un clic avec Alibaba Cloud Storage (par exemple, en spécifiant le préfixe de répertoire du compartiment OSS, en spécifiant un objet du compartiment OSS). ), traitement automatique rapide des données, en intégrant les algorithmes avancés de traitement des données de l'industrie, le moteur de traitement actuel fournit les fonctions suivantes :
Conversion de formats de documents
Il prend en charge la conversion de documents dans 48 formats, dont OFFICE, en 5 formats : JPG, PNG, PDF, TXT et VECTOR, qui peuvent être utilisés pour la navigation dans les documents sur disque réseau et dans d'autres scénarios.
identification du contenu
Identifiez les scènes, les objets, les événements et autres informations dans les images pour réaliser un marquage automatique des images, qui peut être utilisé dans l'examen du contenu des images, la récupération d'images et d'autres scénarios.
Détection facial
Détectez les visages sur les images ainsi que l'âge, le sexe, l'humeur, etc. des personnes et peut être utilisé dans des scénarios tels que la classification d'albums photo.
Détection de code QR
La détection du code QR dans l'image et du contenu stocké dans le code QR peut déterminer si l'image contient des informations de code QR et générer les informations contenues dans le code QR, qui peuvent être utilisées dans des scénarios tels que l'examen du contenu de l'image.
Détection humaine
Détectez les zones du corps humain et les niveaux de confiance dans les images, qui peuvent être utilisées dans des scénarios tels que la détection de comportements anormaux.
Recherche de visage
Recherchez les N premières images les plus similaires à l'image spécifiée. Les résultats sont classés par ordre décroissant de similarité. Ils peuvent être utilisés dans des scénarios tels que la gestion des membres, la classification des albums et la recherche de personnes cibles.
Comparaison des visages
La comparaison de la similarité des deux plus grands visages sur deux images peut être utilisée dans des scénarios tels que la vérification de la reconnaissance d'identité.
Filigrane aveugle d’image
Ajoutez un filigrane aveugle de type image ou texte à l’image. Une fois le filigrane aveugle ajouté, le filigrane ne peut pas être vu directement dans l'image, mais le filigrane caché dans l'image peut être restauré en utilisant la fonction d'analyse du filigrane aveugle de la gestion intelligente des médias, qui peut être utilisée dans des scénarios tels que le traçage des droits d'auteur d'une image. .
gestion des métadonnées
Basée sur les fonctions fournies par le moteur de traitement et grâce à une compréhension et un tri approfondis de la scène, la gestion intelligente des médias encapsule la conception des métadonnées de la scène et fournit l'interface d'accès aux métadonnées de la scène au monde extérieur, simplifiant ainsi la difficulté de conception de application de scène et éliminant le besoin de prêter attention à la base de données d'index de métadonnées Pour les travaux d'exploitation et de maintenance, les index de métadonnées actuellement pris en charge sont les suivants :
Indice de cluster de visages
Construisez une collection de métadonnées, puis appelez l'interface d'index du regroupement de visages pour analyser l'image et ajoutez les métadonnées obtenues à la collection de métadonnées, afin que des visages similaires dans la collection puissent être obtenus. Grâce à cet index, vous pouvez rapidement prendre en charge des scénarios tels que les albums photos de visages sur des disques réseau, la détection d'étrangers pour la surveillance de la maison et la gestion des clients pour les nouveaux commerces de détail.
Index des groupes de balises
Construisez une collection de métadonnées, puis appelez l'interface d'indexation du regroupement de balises pour analyser les images et ajoutez les métadonnées obtenues à la collection de métadonnées, afin que les images puissent être recherchées en fonction des balises. Grâce à cet index, vous pouvez rapidement prendre en charge la recherche de balises telles que des albums de scènes sur le disque réseau, le suivi des animaux pour la surveillance à domicile et des images vulgaires.
couche d'encapsulation de scène
Grâce à la prise en charge des scénarios par Alibaba Cloud, les fonctions de la couche moteur de traitement et de la couche de gestion des métadonnées sont regroupées et fournies sous forme de packages de ressources, simplifiant ainsi l'utilisation, facilitant un accès rapide aux applications et réalisant une intégration étroite de l'IA et des scénarios. , Des exemples de scénarios pris en charge sont les suivants :
Norme documentaire
Intégrez la conversion et la prévisualisation des formats liés aux documents pour bénéficier rapidement de fonctionnalités de gestion intelligente des documents.
Type de norme d'image
Intégrez des fonctions d'IA telles que la reconnaissance de contenu et la détection de visage pour réaliser rapidement une gestion intelligente des images.
Scénarios d'application
Scénario de gestion de documents
Dans des applications telles que les disques réseau, les boîtes aux lettres et la gestion de documents, l'utilisation des projets standard de documents fournis par la gestion intelligente des médias permet de réaliser rapidement les scénarios suivants :
Aperçu du document
Utilisez la fonction de conversion de format pour convertir 48 formats de document courants en 5 types cibles : JPEG, PNG, PDF, TXT et VECTOR. Ensuite, en fonction des résultats de la conversion de format, combinés au moteur de rendu frontal, vous pouvez prévisualiser le document. sur PC et appareils mobiles.
Recherche en texte intégral
Extrayez le texte du document DOC et extrayez-le par page. Sur la base des résultats de l'extraction de texte, créez un index de texte intégral basé sur la page correspondante du document pour obtenir une récupération de texte intégral par page.
Scénario d'analyse sociale de l'image
Dans des applications telles que les réseaux sociaux d'images, les sites Web de commerce électronique et les galeries de photos, l'utilisation des projets standard d'images fournis par la gestion intelligente des médias peut rapidement réaliser les scénarios suivants :
Examen du contenu des images
Utilisez la fonction d'identification de contenu pour identifier efficacement le contenu vulgaire et interdit dans les images, tel que la pornographie, la violence et la terreur, le contenu illégal, etc., afin de répondre aux exigences réglementaires de plus en plus strictes des autorités de régulation en matière de contenu et d'éviter les risques opérationnels.
Utilisez la fonction de détection de code QR pour déterminer si l'image contient un code QR et afficher le contenu du code QR.
Classification et récupération d'images
Utilisez la fonction de reconnaissance de contenu pour marquer et regrouper les images, puis recherchez les images correspondantes dans les galeries de photos, les sites Web de matériel, les disques réseau, les albums photo intelligents et d'autres applications en recherchant des mots-clés.
Traçabilité des droits d’auteur sur les images
Utilisez la fonction de filigrane aveugle d’image pour ajouter un filigrane aveugle de type image ou texte à l’image. Une fois le filigrane aveugle ajouté, le filigrane ne peut pas être vu directement dans l'image, mais le filigrane caché dans l'image peut être restauré en utilisant la fonction d'analyse du filigrane aveugle d'image de la gestion intelligente des médias.
Scénario de stockage de données sur un appareil domestique
Une fois que les appareils domestiques (tels que les caméras) ont téléchargé des photos de famille et des vidéos de surveillance sur OSS, la gestion intelligente des médias analyse les informations faciales des images et des vidéos téléchargées par plusieurs appareils domestiques enregistrés dans OSS, et obtient des informations de métadonnées telles que la détection et le regroupement des visages, et utilise les métadonnées en informations de données peuvent facilement réaliser des fonctions telles que les albums photo de visages et la détection d'étrangers.
De cette manière, l'association de plusieurs appareils et l'interaction entre l'appareil et le cloud sont réalisées, rendant les capacités d'IA de gestion intelligente des médias plus inclusives, apportant ainsi les avantages suivants :
Gestion intelligente de plusieurs appareils
Grâce au traitement des données d'image et vidéo sur plusieurs appareils, une analyse combinée et une gestion intelligente peuvent être réalisées sur le cloud.
Collaboration intelligente entre les appareils et le cloud
Obtenez les métadonnées IA des images et des vidéos avec très peu de bande passante, permettant à l'appareil de profiter rapidement de l'intelligence IA du cloud.
Dans des applications telles que la surveillance domestique et les albums photo intelligents, l'utilisation des projets standard d'image fournis par la gestion intelligente des médias peut rapidement réaliser les scénarios suivants :
Classification et récupération des visages
Utilisez la fonction de recherche de visage pour rechercher les N premières images de la galerie qui ressemblent le plus au visage spécifié. Les résultats sont triés par ordre décroissant de similarité.
Vérification d'identité
Utilisez la fonction de comparaison de visages pour comparer la similitude des deux plus grands visages de deux images afin de détecter des inconnus ou de vérifier si deux personnes sont la même personne.