いまさら聞けないExcelの使い方講座

【Excel】データ分析に役立つ「分析ツール」で「基本統計量」を簡単に求めてビジネスでの判断材料に

Excelの分析ツールを使って基本統計量を求めてみよう

 Excelでは、データ分析に使える統計グラフ(ヒストグラム箱ひげ図)を簡単に作成できることを、過去の記事で解説しました。データ分析をする際に重要な情報として「基本統計量」というものがあります。「基本統計量」とは、データの特性を表す数値で、そのデータ全体にどんな特徴があるのかを把握できます。基本統計量をもとにデータを分析していくことで、ビジネス判断を行うために役立つ情報を見つけ出すことが可能になります。

 今回は、Excelで基本統計量を簡単に求める方法を解説します。

「分析ツール」アドインを追加する

 Excelで基本統計量を求めるには、Excelのアドインを使います。アドインとは文字通り、Excelの基本機能に追加して使用できるプログラムのことです。もともと用意されているアドインもあれば、自分でMicrosoftのサイトからダウンロードして使用するアドインもあります。ここでは、もともと用意されているアドインのうち「分析ツール」を使用します。

 新しいシートを開き、[ファイル]タブ→[オプション]をクリックして[Excelのオプション]画面を表示しておきます。[Excelのオプション]画面の左側のメニューから[アドイン](①)を選択し、画面下側にある[設定](②)をクリックします。

 すると、[アドイン]ダイアログボックスが表示されるので、[有効なアドイン]欄から[分析ツール](③)をクリックしてチェックマークをONにします。[OK](④)をクリックして、ダイアログボックスを閉じます。

 シートに戻るので、[データ]タブ(⑤)をクリックします。するとリボンの右端に[データ分析](⑥)というコマンドが追加されていることがわかります。これで、無事に「分析ツール」アドインが追加されました。

分析ツールを使って基本統計量を求めよう

 アドインを追加できたら、次の「営業成績表」の例を使って、基本統計量を求めてみましょう。この表には、営業1課の各社員が契約した件数が記録されています。では、[データ]タブ(①)→[データ分析](②)をクリックしてみましょう。

 [データ分析]ダイアログボックスが表示されるので、[基本統計量](③)を選択して[OK](④)をクリックします。

 [基本統計量]ダイアログボックスが表示されます。[入力範囲]欄に「$B$2:$B$32」(⑤)と入力します(画面の都合上、すべてのデータは表示されていませんが、実際は32行目まで値が入力されています)。ここでは、見出しのセル(セルB2)も選択したうえで、[基本統計量]ダイアログボックスの[先頭行をラベルとして使用](⑥)のチェックマークをONにします。こうすると、出力結果の表でも先頭のセルがそのまま見出しとして表示されます。

 続けて、[統計情報](⑦)をクリックしてチェックマークをONにしたら、[OK](⑧)をクリックしてダイアログボックスを閉じます。

 すると、新しいシートに基本統計量が出力されます(⑨)。

 これで、基本統計量を求めることができました。次の項では、基本統計量の主な値について解説していきます。

基本統計量の主な値:平均と中央値

 冒頭で、「基本統計量」とは、データの特性を表す数値と解説しました。ここでは、これらの数値のうち、平均と中央値について解説します。

 平均とは、すべてのデータを足し合わせた合計をデータの数で割った数値です。一方、中央値とは、データを順に並べた時に真ん中に位置する数値です。前項で求めた基本統計量を見ると、平均は「18.6」(①)、中央値は「19」(②)ということがわかりますね。

 平均と中央値から何がわかるのでしょうか。別の例を使って、平均と中央値を比較してみましょう。次の例の左側にある表(③)は、1年1組の国語と数学のテストの点数をまとめたものです。右側の表(④)は、左側の表から、前項の手順で求めた基本統計量です。

 基本統計量を見ると、国語の平均は「53.9」(⑤)、中央値は「54」(⑥)で、両者は大体同じですが、数学の平均は「60.3」(⑦)、中央値は「56.5」(⑧)で、両者には少し差異があります。元の表を見るとわかるように、数学のデータには、他の値と大きく異なる値(⑨)があり、そのために平均が上がってしまっているのです。平均が60.3点なのに、実際に60点を超えている人は10人中3人しかいません。「60.3」という得点は、このグループの中間的な点数とはいえないかもしれません。

 もし、先生が「平均点未満の人は追試です」と言ったらどうでしょう。国語では、平均点の53.9点以上取れた人は10人中6人います。したがって、先生のお達しはある程度公平であるといえそうです。一方数学の場合はどうでしょう。平均点の60.3点以上の点数を取れた人は10人中3人しかいません。よって、ほとんどの人が追試となってしまいます。少し不公平な気がしませんか。すごく点数のよい人が1人いるだけで、もしかすると問題が難しすぎたのかもしれません。

 平均と中央値をよく見比べてみると、このようなことが見て取れます。

基本統計量の主な値:標準偏差

 標準偏差は、データのばらつきを表す数値です。値が大きいほど、データにばらつきがあるといえます。全データの値が同じであれば、標準偏差は「0」になります。標準偏差の求め方についてはここでは割愛しますが、平均に対して±標準偏差の範囲内に多くのデータが収まっています。

 先ほどの「営業成績表」の例だと、平均は18.6(①)、標準偏差が5.17(②)なので、13.43~23.77の間に多くのデータが含まれることがわかります。

 基本統計量を見ると、まだまだたくさんの項目がありますが、今回すべては解説しません。基本統計量を含め、データ分析や統計学に関しては、たくさん書籍が出ていますし、Webでもさまざまな情報を探せます。興味のある人は、ぜひ調べてみてください。

 ここでは、特別なツールがなくても、難しい計算式を書かなくても、「分析ツール」アドインを追加するだけで、このように簡単に基本統計量を求められるということを体験してもらえればと思います。

基本統計量を求めてデータ分析をしてみよう

 今回は、Excelの分析ツールを使って、基本統計量を求める方法を解説しました。また、基本統計量の主な項目についても少し触れました。今回解説していない基本統計量の項目について興味のある人は、ほかの書籍などで、さらに学習を進めるとよいでしょう。