ゼロからわかる!データ分析に使う「データ」の集め方【入門】
はじめに:データ分析の第一歩は「データの入手」から
データ分析に興味を持たれたあなたにとって、「データ分析って具体的に何をするんだろう?」という疑問の次に、「そもそも分析するためのデータはどこにあるんだろう?」という疑問が浮かぶかもしれません。
データ分析は、文字通り「データ」がなければ始まりません。私たちが普段ビジネス活動で目にしている様々な情報、例えば売上データ、顧客リスト、Webサイトのアクセス記録、アンケート結果などが、データ分析の材料となります。
しかし、これらのデータは常に分析しやすい形で目の前にあるとは限りません。どこにどんなデータがあるのかを知り、必要に応じて集める作業が必要になります。
この記事では、データ分析をこれから始める未経験者の方に向けて、データ分析に使うことのできる身近なデータの種類と、それらをどのように集めるかの基本的な考え方、そして集める際の注意点をご紹介します。
データ分析に使える「身近なデータ」とは?
私たちの周りには、意識していなくても分析に使えるデータがたくさん存在します。例えば、以下のようなものです。
- 社内の業務データ:
- 売上データ(いつ、誰が、何を、いくらで売ったか)
- 顧客データ(顧客の属性、購入履歴など)
- 在庫データ(商品の在庫数、入出荷情報)
- 勤怠データ(従業員の出勤・退勤時間、残業時間)
- 営業活動記録(顧客への訪問回数、商談状況)
- 社外から得られるデータ:
- Webサイトのアクセスデータ(Google Analyticsなどでわかる訪問者数、ページ閲覧数、どこから来たかなど)
- SNSのデータ(投稿内容、反応数など)
- 市場調査データ(特定の業界の動向、消費者行動など)
- オープンデータ(国や地方公共団体が公開している統計データ、地図情報など)
- 天気データや人口統計データなど、分析の参考にできる公開データ
これらのデータは、様々な形式で存在しています。最も身近なのは、ExcelファイルやCSVファイルのように、行と列で整理されたデータです(構造化データと呼びます)。一方で、メールの文章、画像、動画、音声データのように、決まった形に整理されていないデータもあります(こちらは非構造化データと呼ばれます)。入門段階では、構造化データであるExcelやCSV形式のデータを扱うことから始めるのが一般的です。
身近なデータを集める具体的な方法
では、これらのデータは具体的にどのように手に入れるのでしょうか。
1. 社内システムからダウンロードする
多くの会社では、売上管理システムや顧客管理システム、会計システムなどが導入されています。これらのシステムには、日々の業務で発生したデータが蓄積されています。
分析に必要なデータが特定のシステムにある場合、そのシステムにログインして、必要な期間や項目のデータをCSV形式やExcel形式でエクスポート(出力)できる機能があることが多いです。まずは、社内のシステム担当者や詳しい人に相談してみるのが良いでしょう。
2. 既存のExcelファイルやスプレッドシートを利用する
あなたの部署や会社の共有フォルダに、既に誰かが作成したExcelファイルやGoogleスプレッドシートがあるかもしれません。日報、顧客リスト、経費一覧、簡単な売上集計表など、普段の業務で使われているファイルの中に、分析のヒントになるデータが眠っていることがあります。
これらのファイルを利用する際は、データが最新であるか、必要な項目が全て含まれているかなどを確認しましょう。また、他の人が使っているファイルなので、誤ってデータを変更しないように注意が必要です。可能であれば、ファイルをコピーしてから分析に使いましょう。
3. アンケート結果を集計する
顧客や従業員からアンケートを取ることも、データを集める方法の一つです。GoogleフォームやMicrosoft Formsのような無料ツールを使えば、簡単にWebアンケートを作成・実施できます。回答データは自動的に集計され、スプレッドシートやCSV形式でダウンロードできることがほとんどです。
紙でアンケートを実施した場合は、手作業で集計・データ入力が必要になりますが、これも立派なデータ収集方法です。
4. Webサイトのアクセス解析ツールから取得する
自社のWebサイトを持っている場合、Google Analyticsなどのアクセス解析ツールを導入していることが多いです。これらのツールを使えば、「いつ」「誰が(どこから)」「どのページを」「どれくらい見たか」といった詳細なデータを取得できます。
ツールにログインし、必要な期間や指標を選択してデータをエクスポートすることで、分析用のデータとして利用できます。
5. オープンデータを利用する
国や地方公共団体は、様々な統計データや公共情報を「オープンデータ」としてインターネット上で公開しています。例えば、人口統計、気候データ、交通量データなどがあります。これらのデータは誰でも自由に利用できるものが多く、自社のデータと組み合わせることで、より広い視野での分析が可能になります。
「〇〇市 オープンデータ」「政府統計」などで検索すると、様々なデータが見つかります。多くの場合、CSV形式やExcel形式で提供されています。
データ集めの前に必ず考えたいこと
データ分析を始める前に「何を分析したいのか(目的)」を明確にすることが非常に重要です(これは「データ分析の目的を明確にする最初のステップ」などの記事で詳しく解説しています)。目的が決まれば、それに合わせて「どのようなデータが必要か」がおのずと決まってきます。
データ集めに取りかかる前に、以下の点を考えてみましょう。
- 分析の目的は何か? (例: 「どの年代の顧客がリピート率が高いかを知りたい」「Webサイトのどのページからの問い合わせが多いか調べたい」)
- その目的を達成するために、どんな情報(データ項目)が必要か? (例: 「顧客の年代」「購入履歴」「WebサイトのページURL」「問い合わせ数」など)
- 必要なデータは、どこに存在しそうか? (例: 「顧客管理システム」「売上データ」「Webサイトのアクセス解析ツール」など)
- データはどのような形式で入手できるか? (例: 「Excelファイル」「CSVファイル」「システムからのダウンロード」など)
- データは分析に使える状態か? (例: 「項目が整理されているか」「数値データは数値になっているか」「文字化けしていないか」など)
これらの点を事前に整理しておくと、無駄なく効率的にデータを探し、集めることができます。
データ収集の注意点
データを集める際には、いくつかの注意点があります。
- データの正確性: 入手したデータが本当に正しい情報に基づいているか、古い情報ではないかなどを確認しましょう。入力ミスや集計ミスが含まれている可能性もゼロではありません。
- プライバシーと機密情報: 顧客の個人情報や会社の機密情報など、取り扱いに注意が必要なデータがあります。社内の情報セキュリティポリシーや個人情報保護に関するルールを必ず守りましょう。必要な範囲でのみデータを扱い、安全な場所で保管することが重要です。
- データの「鮮度」: 分析したい内容によっては、最新のデータが必要です。いつ時点のデータなのかを確認し、目的と合っているか確認しましょう。
まとめ:データは身近にある!まずは集めることから始めよう
データ分析と聞くと難しく感じるかもしれませんが、分析に使うデータは実はあなたの会社のシステムや、あなたが普段使っているExcelファイルの中、さらにはインターネット上にも存在しています。
データ分析の第一歩は、分析したいことに関連するデータを「見つけて」「集める」ことから始まります。
まずは、あなたの身の回りにあるデータに目を向けてみてください。そして、「何を分析したいか」を考えながら、必要なデータがどこにあるかを探し、この記事で紹介したような方法で集めてみましょう。
データが集まったら、次はデータを分析しやすい形に「前処理」するステップに進みます。未経験者の方でも、一歩ずつ進めば必ずデータ分析の面白さを実感できるはずです。ぜひ、データの収集から始めてみてください。