より良い分析と意思決定のためにデータをクリーンアップして強化する方法
業界やユースケースを問わず、データドリブンな意思決定がうまくゆくためには、エラーのないデータがすぐに手に入る環境が必要です。しかし手作業によるデータのクリーンアップは時間がかかり、間違いも起こりがちです。
データドリブンな意思決定に取り組む企業が増えるにつれ、可能な限り最高品質のデータを、タイムリーに提供するという担当チームへのプレッシャーは日々高まっています。
新しいレベルのデータ品質とより深い分析をより迅速に達成
では、データ品質担当者はどうすればこの課題に対応できるでしょうか?
データセット全体をソース環境からデータ品質ツールに移し、検証のあと再度元の環境に戻すというアプローチもありますが、多くの企業がデータ分析をクラウドで行いはじめている現在、この方法は効率的でも理想的でもありません。
すでにデータをクラウドに複製している場合に最適なシナリオは、ワークフローとルール自体を変更してクラウド環境の中でそのデータを検証するというものです。これにより、リスク軽減と同時に時間も節約し、効率を上げることができます。
Precisely Data Integrity Suite のデータ クオリティ サービスがこのアプローチを可能にします。データが完全で重複がなく、適切にフォーマットされ、標準化されていることを保証するだけでなく、AI ベースのインテリジェンスを使用して、修復が必要なデータに対しても迅速に修正案を提示します。
2023 Data Integrity Trends & Insights
Results from a Survey of Data and Analytics Professionals
データ品質に関して最も問題になりやすいのが住所データです。管理の不適切な住所データは、最も取り扱いが難しいデータの 1 つと言えます。そのため、適切な検証とジオコーディングが不可欠です。Data Integrity Suite のジオアドレッシング サービスは、非常に正確な緯度/経度座標と一意の識別子である PreciselyID を1 つひとつの住所に割り当てることで検証とジオコーディングをシームレスに行い、最後のステップであるデータ強化を効率化します。
データが検証されジオコーディングされたら、そのデータに外部データセットに付加し、強化します。スイートのデータ エンリッチメント サービスを使用すると、何百もの厳選された最新のデータセットから属性を添付することで、分析のための豊富で価値のあるコンテキスト(付加情報)を追加できます。また、PreciselyID を使用して付加情報を検索すると、最も関連性の高い情報を迅速に発見し、より適切でタイムリーな意思決定を行うことが可能になります。
実際のユースケースではどのように機能するのか?
これまで説明したような仕組みは、実際にはどのように機能するのでしょうか? あなたの組織が、ある製品を新しい市場に拡大する使命を負っているとします。クラウド環境に潜在顧客のリストがすでに準備済みですが、データ品質は必要なレベルに達していません。
Data Integrity Suite を使用して、データをクリーンアップし、より優れたコンテキストと洞察を得るためにデータを強化するための 3 つのステップを見てみましょう。
ステップ 1: データ品質の問題を特定して修正する
Precisely のデータ クオリティ サービスが持つユニークな特徴は、ソース環境からデータを移動しなくても問題を特定して修正できることです。データ品質担当者は、このサービスを使用してデータセットをプレビューし、品質、分布、その他の主要な指標を確認できます。
機械学習インテリジェンスがデータの最適なクリーンアップ方法を推奨してくれますので、さらに時間を節約できます。
住所、都市、州などの場所を調べることを選択したとします。Suite は不一致データ (住所データに関する一般的な問題) を把握し、住所の標準化または検証とジオコーディングの推奨プランを提示します。
ステップ 2: 地理コード化して PreciselyID を添付する
住所の検証、標準化、クレンジング、ジオコード化を行い、より多くの情報に基づいた意思決定を行うための貴重なコンテキストを明らかにする問題を特定したら、潜在顧客データセット内の住所情報を検証してジオコーディングします。ジオコーディングにより、非常に正確な緯度/経度の座標と一意の永続的な識別子である PreciselyID が各住所に割り当てられます。
住所の検証、標準化、クレンジング、ジオコード化を行い、より多くの情報に基づいた意思決定を行うための貴重なコンテキストを明らかにする問題を特定したら、潜在顧客データセット内の住所情報を検証してジオコーディングします。ジオコーディングにより、非常に正確な緯度/経度の座標と一意の永続的な識別子である PreciselyID が各住所に割り当てられます。
これらはすべて、Suite のジオアドレッシング サービスで実現されます。
住所が検証され、ジオコーディングされ、PreciselyID が付与された後、データの価値を最大化するにはどうすればよいでしょうか?
ステップ 3: データ品質パイプラインで住所データを強化する
Suite のデータ エンリッチメント サービスに移行する時がやってきました。 PreciselyID を使用すると、データ分析担当者や実務担当者にとって非常に有用な、豊富なコンテキスト情報を住所に追加できます。
この強化は、内部データ以外の情報も随時分析に利用できるということを意味しています。 Precisely データ エンリッチメント カタログには、例えば不動産の詳細やそのリスクなどをはじめとする、さまざまな属性情報が含まれています。
処理パイプラインが完成したら、ネイティブ環境で直接実行できます。デプロイされると、新しく改善されたデータセットもスイートの共有データ カタログに保存され、他のユーザーやデータ利用者は、今後必要となった時にいつでもアクセスできるようになります。
これら 3 つのステップによって、正確で欠落がなく、コンテキストによって強化されたデータを実現するデータ パイプラインが完成します。これによって、ターゲティング、レポート、分析、意思決定を適切なデータによって強化しながら、ビジネス拡大の取り組みを進めることができます。
Preciselyは、ドレクセル大学レボー・カレッジ・オブ・ビジネスと提携し、世界中のデータおよびアナリティクスの専門家450人以上を対象に、データプログラムの状況について調査を行いました。 その画期的な結果を「2023 Data Integrity Trends and Insights Report」として発表します。