マインドマップギャラリー データ開発チームの計画
これは、能力構築を含むデータ開発チームの計画に関するマインド マップです。 医療事業力、 エンジニアリング技術力、チームビルディングなど
2024-01-09 18:05:58 に編集されましたデータ開発チーム
スキルの構築
医療事業力
デマンドドッキング
データ探索プロジェクト
ユニバーサルデータガバナンス
データ制作プロジェクト
特殊な病気
ウィンタージャスミン
1 つの病院、複数の地区
カントリーレポート
他の製品
ソリューションと提供
分析とレビューが必要
プロジェクト管理とデータ配信
モデルの設計と最適化
モデル設計
バージョン管理
エンジニアリング力と技術力
需要実現計画の解体
データ範囲とデータフロー
データ更新計画
開発計画と人件費
保管コスト
データアクセス
jdbc/odbc
休息/ウェブサービス
データベースのバックアップとリカバリ
CDC/OGG
ファイル/ftp
データ制作
SQL
スパーク
DSL UDF
UDF でカプセル化された NLP
複数のデータソースに同時にアクセスする
データ制作ツール開発
開発言語
ジャワ
パイソン
DSL
機能分類
モデルマッピング
DSL
SQL
スパークタスク
データ増強
クリーニング/辞書の正規化
エンピ/エモイ
医療記録の分析
一般的な html/xml
前処理
スプリット
文書タイプの標準化
章の分析
平文医療記録の処理
XMLを変換する
定期抽出
品質管理ツール
単一フィールド
規範的な
標準レート(辞書または値の範囲付き)
ノーマルレート(通常のノーマル)
主キーの一意性
ヌル率
複数のフィールド
関連性
ビジネス上の合理性
トランスミッションの違い
行数の違い
フィールド値率/null値率の差
データ系統
生産効率、安定性、一貫性
オフラインデータフロー
スパーク
リアルタイムデータストリーミング
カフカ/フリンク/スパークストリーミング
バッチストリーム統合/データレイク
フーディ/クドゥ
チームビルディング
ツールと知識の蓄積
HIT辞書・医療知識
git/wiki/ツールプラットフォーム
プロジェクトSOP
人員配置のニーズ
データ開発(3~4名)
文書分析
empi、emoi、クリーニング、辞書の正規化
NLP の生成、患者レベルの集計
データ品質管理
データ納品(プロジェクト別)
配達人
データ制作
データ品質管理
図書館
データ階層化
一般層化理論
運用データストア: ODS
詳細データ レイヤー (データ ウェアハウスの詳細):DWD
サマリー データ レイヤー (データ ウェアハウス サマリー):DWS
アプリケーション データ ストア:ADS
シーンの適応
ods(オリジナル c1)
ods_clean (オリジナルの c2)
データ期間内の小さなファイルの結合
一般的なデータクリーニング(前処理)
ハイブインデックス
dwd
エンピ
病院に
病院の向こう側
empi関連のテーブル構造設計
患者登録
患者の最新情報
患者分割
変更ログ
患者クロスインデックス
仮想患者
エモイ
visit_sn の完了
バーチャル訪問
NLP の正規化
パーティション(データ期間)の次元削減
ビジネス固有のキー設計 (pkid)
電子カルテ解析
大きな文書を分割する
文書タイプの標準化
章の分析
診断全表、手術全表など
dws/mid std (NLP プロダクションおよびデータ集約レイヤー)
構造化された正規化
広告(ラベルリスト・特殊疾患データベース)
生産タスクの分類
マッピング
スパーク
DSL
マッピング仕様
パフォーマンスの最適化
大きなテーブルに参加する
データの偏り
中間データをキャッシュ再利用
データフローを合理化する
データソース全体で実行
ストリーミングコンピューティングをサポート
きれい/普通
実行フレームワーク: Spark DataFrame 構成
ビジネス ロジック: udf
データ増強
スパーク
データ期間の次元削減
エンピ
エモイ
UDTF/UDF
電子カルテ解析
NLP フィールドの作成とデータ集約
データ品質管理
単一フィールドのルール
ヌル率
標準料金
違反率
貴重な数字
主キーの一意率
クロステーブルルール
孤立したデータ
カスタマイズされたビジネスルール
クロスデータベースルール
データ層間の差分を転送する
同じデータ層を更新する場合の違い
生産仕様
プロジェクト設立制作プロセス
要件入力の分析と解体
制限時間
病院一覧
詳細フィールド
特別な処理要件 (感度解除、エンピ、データ品質要件など)
ニーズ評価
人材ニーズの評価
ストレージとコンピューティング リソースの評価
データモデルのコンプライアンス評価
ソリューションのレビュー
生産計画
品質管理計画
スケジュール
製造と納品
データモデルの設計
データ開発
データ制作
データ品質管理
データ配信
生産タスク管理
タスクの命名規則
ストレージパスの指定
ユーザー管理、キュー権限、リソース管理
品質管理基準と計画