Galerie de cartes mentales Planification de l'équipe de développement de données
Il s'agit d'une carte mentale sur la planification de l'équipe de développement de données, y compris le renforcement des capacités, Capacités commerciales médicales, Capacités techniques d’ingénierie, team building, etc.
Modifié à 2024-01-09 18:05:58Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Équipe de développement de données
Développement de compétences
Capacités commerciales médicales
Amarrage à la demande
Projet d'exploration de données
Gouvernance universelle des données
Projet de production de données
Maladie spéciale
jasmin d'hiver
Un hôpital, plusieurs districts
rapport pays
autres produits
Solutions et livraison
Analyse et revue des besoins
Gestion de projet et livraison de données
Conception et optimisation du modèle
Conception du modèle
contrôle de version
Capacités d’ingénierie et techniques
Démantèlement du plan de réalisation de la demande
Portée des données et flux de données
Plan de mise à jour des données
Plan de développement et coûts de main d'œuvre
coût de stockage
accès aux données
jdbc/odbc
reposant/webservice
Sauvegarde et restauration de base de données
cdc/ogg
fichier/ftp
production de données
SQL
étincelle
DSL UDF
PNL encapsulé udf
Accédez simultanément à plusieurs sources de données
Développement d'outils de production de données
Langage de développement
Java
python
DSL
Classement fonctionnel
cartographie du modèle
DSL
SQL
tâche d'étincelle
augmentation des données
Nettoyage/normalisation du dictionnaire
empi/emoi
Analyse du dossier médical
HTML/XML générique
prétraitement
Diviser
Standardisation des types de documents
Analyse du chapitre
Traitement des dossiers médicaux en texte brut
Convertir XML
Extraction régulière
Outils de contrôle qualité
champ unique
normatif
Tarif standard (avec dictionnaire ou plage de valeurs)
Taux normal (norme régulière)
unicité de la clé primaire
taux nul
Plusieurs champs
pertinence
caractère raisonnable des affaires
Différences de transmission
Différence du nombre de lignes
Différence entre taux de valeur de champ et taux de valeur nulle
Lignage des données
Efficacité de production, stabilité, cohérence
Flux de données hors ligne
étincelle
diffusion de données en temps réel
kafka/flink/étincelle streaming
Intégration de flux par lots/lac de données
hudi/koudou
Construction d'équipe
Outils et accumulation de connaissances
Dictionnaire HIT/Connaissances médicales
git/wiki/outil-plateforme
POS du projet
Besoins en personnel
Développement de données (3-4 personnes)
Analyse de documents
empi, emoi, nettoyage, normalisation du dictionnaire
Production PNL, agrégation au niveau du patient
Contrôle de la qualité des données
Livraison des données (par projet)
livreur
production de données
Contrôle de la qualité des données
Une bibliothèque
Hiérarchisation des données
théorie générale de la stratification
Magasin de données opérationnelles : ODS
Couche de données détaillée (Data Warehouse Detail) : DWD
Couche de données récapitulative (Résumé de l'entrepôt de données) : DWS
Magasin de données d'application : ADS
Adaptation scénique
ods (original c1)
ods_clean (c2 d'origine)
Fusion de petits fichiers au cours d'une période de données
Nettoyage général des données (prétraitement)
index de la ruche
dwd
empi
À l'hôpital
à travers l'hôpital
conception de la structure de la table liée à l'empi
Inscription des patients
Mises à jour des patients
patient divisé
journal des modifications
index croisé des patients
patient virtuel
émoi
complétion de visit_sn
visite virtuelle
Normalisation PNL
Réduction de la dimensionnalité de la partition (période de données)
Conception de clé unique pour l'entreprise (pkid)
Analyse du dossier médical électronique
Divisez des documents volumineux
Standardisation des types de documents
Analyse du chapitre
Table complète de diagnostic, table complète chirurgicale, etc.
dws/mid std (couche de production NLP et d'agrégation de données)
Normalisation structurée
annonces (liste d'étiquettes/base de données de maladies spéciales)
Classification des tâches de production
cartographie
Étincelle
DSL
Spécification de mappage
Optimisation des performances
rejoindre une grande table
Désalignement des données
Cache réutiliser les données intermédiaires
Rationalisez le flux de données
Exécuter sur plusieurs sources de données
Prise en charge de l'informatique en streaming
propre/norme
Framework d'exécution : configuration Spark DataFrame
Logique métier : udf
augmentation des données
Étincelle
Réduction de la dimensionnalité de la période de données
empi
émoi
udtf/udf
Analyse du dossier médical électronique
Production de terrain PNL et agrégation de données
Contrôle de la qualité des données
Règles de champ unique
taux nul
taux standard
taux d'infraction
Numéro précieux
Taux unique de clé primaire
Règles des tableaux croisés
Données orphelines
Règles métier personnalisées
Règles inter-bases de données
Transférer les différences entre les couches de données
Différences dans la mise à jour de la même couche de données
spécifications de production
Processus de production de l'établissement du projet
Analyse et démantèlement des besoins
limite de temps
Liste des hôpitaux
Champs détaillés
Exigences particulières de traitement (désensibilisation, empi, exigences de qualité des données, etc.)
évaluation des besoins
Évaluation des besoins en main d’œuvre
Évaluation des ressources de stockage et de calcul
Évaluation de la conformité du modèle de données
Examen des solutions
plan de production
Plan de contrôle qualité
Calendrier
Production et livraison
Conception de modèles de données
développement de données
production de données
Contrôle de la qualité des données
livraison de données
Gestion des tâches de production
Convention de dénomination des tâches
Spécification du chemin de stockage
Gestion des utilisateurs, autorisations de file d'attente, gestion des ressources
Normes et plans de contrôle qualité