Galerie de cartes mentales Ingénieur en gouvernance des données DAMA-CDGA-9.
La gestion des fichiers et du contenu fait référence à la gestion de la collecte, du stockage, de l'accès et de l'utilisation des données et informations stockées en dehors des bases de données relationnelles, en se concentrant sur le maintien de l'intégrité des fichiers et autres informations non structurées ou semi-structurées et en rendant ces informations accessibles.
Modifié à 2024-03-05 20:25:41Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
9. Gestion des fichiers et du contenu
introduction
Gestion des fichiers et du contenu
Désigne la gestion de la collecte, du stockage, de l'accès et de l'utilisation des données et informations stockées en dehors des bases de données relationnelles.
L'accent est mis sur le maintien de l'intégrité des documents et autres informations non structurées ou semi-structurées et sur la nécessité de rendre ces informations accessibles.
moteurs d'activité
Les principaux facteurs incluent les exigences de conformité réglementaire, la réactivité aux litiges et les capacités de demande de découverte électronique, ainsi que les exigences de continuité des activités.
Une bonne gestion des documents peut également aider les organisations à devenir plus efficaces
Des sites Web bien organisés, cohérents et consultables, basés sur des ontologies et d'autres ressources gérées efficacement, contribuent à accroître la satisfaction des clients et des employés.
Les lois et réglementations exigent que les organisations tiennent des registres de certaines activités
Les archives comprennent des documents papier et des informations stockées électroniquement ESI
Une bonne gestion des dossiers est nécessaire pour maintenir la continuité des activités et donne également à l'organisation la capacité de répondre aux litiges.
La découverte électronique est le processus de localisation d'enregistrements électroniques pouvant être utilisés comme preuve dans une procédure judiciaire.
La capacité d'une organisation à répondre à l'eDiscovery dépend de la façon dont elle gère de manière proactive les archives telles que les e-mails et les documents électroniques, ainsi que les données brutes et les métadonnées des applications.
Une efficacité accrue est un moteur d’une meilleure gestion des documents
Les avancées technologiques en matière de gestion documentaire aident les organisations à rationaliser les processus, à gérer les flux de travail, à éliminer les tâches manuelles répétitives et à permettre la collaboration.
objectifs et principes
Cible
Garantir que les données et informations non structurées peuvent être collectées et utilisées efficacement et à grande vitesse
Assurer les capacités d’intégration entre les données structurées et non structurées
Respecter les obligations légales et répondre aux attentes des clients
en principe
Chacun dans l'organisation a un rôle à jouer dans la protection de l'avenir de l'organisation
Les experts en archives et en traitement de contenu devraient être pleinement impliqués dans le développement des systèmes et des plans
Principes de gestion des fichiers
principe de responsabilité
L'organisation doit désigner des cadres supérieurs appropriés, adopter des systèmes et des processus pour guider les employés et garantir la vérifiabilité des plans.
principe d'intégrité
Établir un plan de gouvernance de l'information afin que les enregistrements et les informations créés ou gérés par l'organisation soient justifiés et disposent des assurances appropriées d'authenticité et de fiabilité.
principe de protection
Établir un plan de gouvernance de l'information pour assurer une protection raisonnable des informations personnelles ou d'autres informations qui doivent être protégées
Suivez les principes
Établir un plan de gouvernance de l'information et se conformer aux lois, réglementations et autres exigences institutionnelles contraignantes applicables des institutions et organisations
Principes disponibles
L'organisation doit s'assurer que ses informations sont conservées en temps opportun, de manière efficace et exacte.
principe de rétention
Les informations de l’organisation doivent être conservées pendant une période de temps appropriée, en tenant compte des exigences de toutes les contraintes opérationnelles, juridiques, réglementaires et financières ainsi que de toutes les autres contraintes pertinentes.
Principe d'élimination
L'organisation doit assurer un traitement sécurisé et approprié des informations conformément à ses systèmes, aux lois et réglementations applicables et aux autres exigences institutionnelles contraignantes.
Principe de transparence
L'organisation doit documenter ses systèmes, processus et activités, y compris son plan de gouvernance de l'information, d'une manière compréhensible pour le personnel et les parties prenantes.
concept de base
contenu
Fait référence aux données et informations contenues dans un document, une archive ou un site Web.
Gestion de contenu
définition
Comprend des processus, des méthodes et des techniques pour organiser, classer et structurer les ressources d'informations afin qu'elles puissent être stockées, publiées et réutilisées de diverses manières.
Cycle de vie du contenu
dynamique
Effectuer des changements quotidiens
statique
Changer rarement ou occasionnellement
gérer
gestion formelle
Stockage, gestion, audit, conservation et élimination stricts
gestion informelle
via des mises à jour intermédiaires
Gestion de contenu d'entreprise
La gestion de contenu est particulièrement importante dans les sites Web et les portails
Lorsque la gestion de contenu est effectuée à l'échelle de l'entreprise, on parle d'Enterprise Content Management (ECM).
métadonnées de contenu
Les métadonnées sont essentielles à la gestion des données non structurées, qu'il s'agisse de contenus et de fichiers traditionnellement considérés, ou de ce que l'on appelle désormais « big data ».
Le contenu ne peut pas être catalogué et organisé sans métadonnées
modélisation de contenu
définition
Est-ce le processus de conversion des concepts de contenu logique en types de contenu relationnel, attributs et types de données
niveau
niveau du produit
Produira des livrables réels
niveau composant
Plus de détails sur les éléments qui composent le modèle de produit d'information
Méthode de distribution de contenu
Type de poussée
Type de traction
interactif
vocabulaire contrôlé
Aperçu
Un vocabulaire contrôlé est une liste définie dont l'utilisation est explicitement autorisée pour indexer, catégoriser, indexer, trier et récupérer des données via la navigation et la recherche.
L'organisation systématique des documents, des archives et du contenu nécessite des vocabulaires contrôlés
Un exemple de vocabulaire contrôlé est l'ensemble d'éléments Dublin Core pour la classification des publications.
Les vocabulaires contrôlés constituent une sorte de données de référence
Comme les autres données de référence, leurs valeurs et définitions doivent être gérées pour garantir leur exhaustivité et leur actualité.
Parce qu'elles aident à expliquer et à soutenir l'utilisation d'autres données, elles peuvent également être considérées comme des métadonnées.
Gestion du glossaire
C'est le processus de définition, de recherche, d'importation et de maintenance d'un vocabulaire donné.
vue glossaire
Est un sous-ensemble d'un vocabulaire contrôlé qui couvre une gamme limitée de sujets dans le domaine du vocabulaire contrôlé
Les vues de glossaire sont nécessaires lorsque l'objectif est d'utiliser un vocabulaire standard contenant un grand nombre de termes, mais que tous les termes ne sont pas pertinents par rapport aux informations dont le client a besoin. Par exemple, une vue qui inclut uniquement les termes liés à l'unité commerciale Marketing n'inclura pas les termes liés à Finance.
Glossaire du microcontrôle
Glossaire contenant des termes hautement spécialisés non inclus dans les glossaires généraux
Un exemple de vocabulaire de microcontrôle est un dictionnaire médical avec des sous-ensembles de sujets médicaux.
liste de termes
n'est qu'une liste et ne décrit pas la relation entre les termes
sélectionner la liste
Généralement caché dans les applications
Gestion terminologique
Comprend des détails sur la façon dont le terme a été défini et classé à l'origine, a commencé à être utilisé par différents systèmes et est conservé par la suite.
synonyme anneau
fait référence à un groupe de termes qui ont à peu près la même signification
Autoriser les utilisateurs qui recherchent l'un des termes à accéder au contenu lié à d'autres termes du cercle de termes
Le Synonym Ring Manual a été développé pour la récupération plutôt que pour l’indexation
Tableau des spécifications
est un vocabulaire contrôlé de termes descriptifs conçu pour faciliter la récupération d'informations dans un domaine ou une portée spécifique
taxonomie
Schémas de classification et étiquetage
Les schémas de classification sont des codes qui représentent des mots contrôlés
Thésaurus
Ontologie
Décrire les classes (concepts), les individus (instances), les attributs, les relations et les événements
Gestion des documents et des archives
document
Objet électronique ou papier contenant une description d'une tâche, les exigences relatives à la manière et au moment où une tâche ou une fonction doit être exécutée, ainsi qu'un journal de l'exécution des tâches et des décisions.
déposer
Seuls certains documents peuvent être qualifiés d'archives
Peut être utilisé pour prouver que les décisions prises et les actions entreprises sont conformes aux procédures
Peut être utilisé comme preuve des activités commerciales d’une organisation et de sa conformité réglementaire
Gestion de fichiers
Comprend les processus, méthodes et techniques de contrôle et d'organisation des documents et des archives tout au long de leur cycle de vie
Comprend le stockage, le catalogage et le contrôle des documents électroniques et papier
Gestion de fichiers
fait partie de la gestion des fichiers
Les archives peuvent être physiques, électroniques, des fichiers sur des sites Web, du matériel informatique ou des archives mixtes.
Archives critiques Archives nécessaires à la restauration des opérations d'une organisation en cas de sinistre
Signer un fichier contribue à son intégrité
Caractéristiques
contenu
Le contenu doit être exact, complet et véridique
arrière-plan
Le créateur, la date et d'autres informations descriptives sur le profil doivent être collectées, organisées et conservées au moment de la création du profil.
opportunité
Les profils doivent être créés immédiatement après qu'un événement, une action ou une décision se produise
permanent
Une fois devenu fichier, son contenu ne peut être modifié pendant la durée légale de conservation du fichier.
structure
L'apparence et la présentation du contenu du dossier doivent être claires et elles doivent être enregistrées sur des formulaires et modèles corrects et corrects.
De nombreuses archives existent sous format électronique et papier
La gestion des documents exige que les organisations sachent quelle copie (électronique ou papier) est la copie officielle afin de respecter les obligations de conservation des documents.
Une fois qu'une copie du fichier est identifiée, les autres copies peuvent être détruites en toute sécurité.
Gestion des actifs numériques
Il se concentre sur le stockage, le suivi et l’utilisation de fichiers multimédias riches tels que des vidéos, des logos, des photos, etc.
Carte des données
Est un inventaire de toutes les sources de données ESI, applications et environnements informatiques, y compris des informations telles que les propriétaires d'applications, les dépositaires, les emplacements géographiques pertinents et les types de données.
Découverte électronique
La découverte est un terme juridique qui fait référence à la phase préalable au procès du litige au cours de laquelle les parties se demandent mutuellement des informations afin de vérifier les faits de l'affaire et de comprendre la force des arguments de chaque partie.
architecture de l'information
est une structure créée pour un ensemble d'informations ou de contenu
Composants
vocabulaire contrôlé
Taxonomies et ontologies
mappage des métadonnées
Spécifications de la fonction de recherche
Exemple
flux d'utilisateurs
L'architecture de l'information et la politique de contenu décrivent ensemble le « quoi », c'est-à-dire quel contenu sera géré dans le système.
La phase de conception décrit « comment » mettre en œuvre un système de gestion de contenu
moteur de recherche
Est un logiciel qui recherche des informations en fonction de termes et récupère des sites Web dont le contenu contient ces termes.
Composants
Logiciel de moteur de recherche approprié
Crawler qui parcourt le Web
Stockage contenant les URL
Mots-clés et texte
Règles de classement
modèle sémantique
Il s'agit d'une sorte de modélisation des connaissances qui décrit une série de réseaux conceptuels et les relations entre eux.
Intégrés aux systèmes d'information, les modèles sémantiques permettent aux utilisateurs de poser des questions d'information de manière non technique.
composition
objet sémantique
est quelque chose représenté dans le modèle
contraintes sémantiques
Représente des modèles d'association ou de classe d'association dans UML qui aident à identifier des modèles et des tendances et à découvrir des relations entre des informations qui peuvent sembler sans rapport.
Recherche sémantique
Concentrez-vous sur la sémantique et le contexte plutôt que sur des mots-clés prédéterminés
Les moteurs de recherche sémantiques peuvent utiliser l'intelligence artificielle pour identifier les correspondances de requêtes en fonction des mots et de leur contexte.
Les exigences de la recherche sémantique incluent la détermination de ce que veut l'utilisateur, ce qui signifie penser comme l'utilisateur.
données non structurées
format électronique
Fichiers de traitement de texte, courrier électronique, réseaux sociaux, salons de discussion, fichiers plats, feuilles de calcul, fichiers XML, messages transactionnels, rapports, graphiques, images numériques, vidéo, audio
Documents papier
Contient également une grande quantité de données non structurées
Les principes de base de la gestion des données s'appliquent aussi bien aux données structurées que non structurées.
Flux de travail
Le développement du contenu doit être géré via un flux de travail pour garantir que le contenu est créé à temps et reçoit les approbations appropriées.
Il doit être automatisé grâce à l'utilisation d'un système de gestion de contenu (CMS) ou d'un autre système plutôt que d'un processus manuel.
Activité
Planification de la gestion du cycle de vie
Gestion des dossiers de plans
Développer une stratégie de contenu
Créer un système de gestion de contenu
Définir l'architecture des informations de contenu
Gestion du cycle de vie de la mise en œuvre
Obtenez des archives et du contenu
Gérer le contrôle de version
Sauvegarde et restauration
Gérer la garde et l'élimination
Documents/archives d’audit
Publier et diffuser du contenu
Accès ouvert, recherche et récupération
Distribuer via des canaux acceptables
outil
Système de gestion de contenu d'entreprise
Gestion de fichiers
Un système de gestion de documents est une application utilisée pour suivre et stocker des documents électroniques et des images électroniques de documents papier.
Possède généralement des capacités de stockage, de contrôle de version, de sécurité, de gestion des métadonnées, d'indexation de contenu et de récupération
Le système de gestion de fichiers dispose d'un module de gestion des autorisations qui permet aux administrateurs de gérer les autorisations d'accès en fonction des types de fichiers et des informations d'identification des utilisateurs.
Les signatures électroniques garantissent l'identité de l'émetteur du document et l'authenticité des informations
Gestion des actifs numériques
Audio, vidéo, musique, photos numériques
système de traitement d'images
Fichiers images et électroniques pour capturer, convertir et gérer des documents papier
Les techniques de collecte comprennent
balayage
reconnaissance de la lumière
ROC
Reconnaissance intelligente des caractères
ICR
traitement du formulaire
image
Vecteur
Utilisez des formules numériques au lieu de blocs de couleurs individuels
Idéal pour créer des graphiques qui doivent souvent être redimensionnés
Les formats de fichiers incluent .EPS/.AI/.PDF
Raster (bitmap)
Utilisez un nombre fixe de pixels colorés pour former une image complète
La résolution sera affectée lors du redimensionnement
Les formats de fichiers incluent .JPEG/.GIF/.PNG/.TIFF
Format DOC de MS WORD
Système de gestion de fichiers
Doit disposer d'un stockage et d'une élimination automatisés, d'un support de collecte de preuves électroniques et de capacités d'archivage à long terme
Soutenir les procédures d'archivage vitales pour conserver les archives critiques pour l'entreprise
système de gestion de contenu
Le CMS est utilisé pour collecter, organiser, indexer et récupérer du contenu, en stockant le contenu sous forme de composants ou de fichiers entiers tout en conservant les liens entre les composants.
Même si un système de gestion de documents peut fournir des capacités de gestion de contenu pour les documents sous son contrôle, un système de gestion de contenu est intrinsèquement indépendant de l'endroit et de la manière dont les documents sont stockés.
CMS est responsable de la gestion de l’ensemble du cycle de vie du contenu
Flux de travail de contenu et de documents
Les outils de workflow prennent en charge les processus métier, acheminent le contenu et les fichiers, attribuent des tâches de travail, suivent l'état et créent des pistes d'audit.
Workflow prend en charge la révision et l'approbation du contenu avant sa publication
Outils de collaboration
Blog, WIKI, RSS, etc.
Vocabulaires contrôlés et tableaux de métadonnées
Format de balisage et d'échange standard
Langage de représentation extensible XML
Fournit un langage pour représenter des données et des informations structurées et non structurées
de plus en plus important
XML fournit la fonctionnalité permettant d'intégrer des données structurées dans des bases de données relationnelles avec des données non structurées
Les données non structurées peuvent être stockées dans des systèmes de gestion de données relationnelles BLOG ou des fichiers XML
XML peut intégrer des données structurées et non structurées
XML peut également être utilisé pour créer des portails d'entreprise ou de société, offrant aux utilisateurs un point d'accès à une variété de contenus.
XML identifie et marque les données/contenus non structurés afin que les applications informatiques puissent les comprendre et les traiter
Un format d'échange de données léger JSON basé sur le langage JavaScript
Est un format standard d'échange de données ouvert et léger
Son format de texte est indépendant de la langue et facile à analyser, mais reste une manière idiomatique d'utiliser la famille des langages C.
JSON devient le format privilégié pour les bases de données Internet et NOSQL
En remplacement de XML, JSON est utilisé pour transmettre des données entre les serveurs et les applications Web
Ressource Description Framework Spécifications RDF et World Wide Web Consortium W3C
RDF décrit les ressources sous la forme d'un sujet (ressource) - d'un prédicat (nom d'attribut) - d'un objet (valeur d'attribut), d'une expression ou d'un triplet.
Schéma.org
Permettre aux moteurs de recherche sémantiques de rechercher plus facilement du contenu et aux robots d'exploration Web de faire correspondre le contenu aux recherches
technologie d'investigation électronique
méthode
Manuel de réponse aux litiges
Cartographie des données de réponse aux litiges
Guide de mise en œuvre
État de préparation/évaluation des risques
Maturité de la gestion des documents
en dessous de la moyenne
développement
basique
positif
terminé le changement
Évaluation de la découverte électronique
Changement organisationnel et culturel
Gouvernance des fichiers et du contenu
architecture de gouvernance de l'information
explosion d'informations
Gérer du contenu de haute qualité
Métrique
Gestion de fichiers
Découverte électronique
Gestion de contenu d'entreprise