| インテリジェンス's profileマイクロソフト BI チームのブログBlogLists | Help |
マイクロソフト BI チームのブログマイクロソフト日本法人でビジネス インテリジェンスを推進するチーム メンバーのブログです。ご意見ご要望などは、記事へのコメント欄やゲストブックにお気軽にお書込みください。 |
||||||||||||
|
April 01 Windows Server 2008 と SQL Server 2008 に SharePoint Server 2007 SP1 と PerformancePoint Server 2007 SP2 をインストールしてみようPerformancePoint Server 2007 SP2 がリリースされたことにより、Windows Server 2008 だけでなく SQL Server 2008 にも対応するようになりました。今回は SharePoint Server も含む最新環境をクリーンインストールしたいと思います。 なお、デモ用のスタンドアロンマシンとして構成するので、いつものように Active Directory ドメインコントローラーの役割も併用しますが、いつも通りこの構成はサポート対象外です。また外部からの接続なども想定していないのでネットワークセキュリティには配慮していません。これらの点に十分ご注意ください。 そして今回は、PerformancePoint Planning のオペレーションレポートが使えなくなるのを覚悟の上で、SQL Server 2008 Reporting Services を SharePoint 統合モードで構成し、Report Builder 2.0 を使ったセルフサービスレポーティング環境も用意したいと思います。主なステップは以下のようになります: STEP 0: Windows Server 2008 を Active Directory ドメインコントローラーとして構成する (以下順不同) STEP 0: Windows Server 2008 を Active Directory ドメインコントローラーとして構成する 以前もご紹介 していますのでここでは詳細は省きますが、Windows Server 2008 をインストールしたら、「サーバー マネージャ」 の 「役割」 で ”Active Directory ドメイン サービス” と “Web サーバー (IIS)” を追加します。Web サーバーの追加の際には、デフォルトのオプションだけでは足りないので、”HTTP リダイレクション”、”ASP.NET”、”Windows 認証”、”IIS 6 管理互換” にチェックを追加してください (依存関係のあるいくつかのコンポーネントとともに追加インストールされます)。なお、ドメイン サービスの追加は他のサービスの追加と同時には実行できないので、はじめに単独で追加してから再起動してください。サービスの追加が無事終わりましたら、後ほど PerformancePoint のアプリケーション プールで使うアカウントを作成しておきます。その方法については こちらを参照 してください。 STEP 1: SQL Server 2008 をインストールする さて、DC として構成した Windows Server 2008 に SQL Server 2008 Enterprise Edition をインストールします。環境チェックで、ドメイン コントローラーであることと、ファイアウォールの設定について注意されると思いますが、デモ環境なので気にしなくて結構、無視してインストールします。 インストールのオプションでは全てのコンポーネントを選択しましょう。各コンポーネントのサービスアカウントを聞かれますが、面倒なので全て LOCAL SYSTEM アカウントにしておきます (本番環境ではちゃんとセキュリティに配慮した専用アカウントをご用意ください)。ただし一点、Reporting Services に関しては、「サーバーを構成せずにインストールする」を選択しておいてください。別途 SharePoint Server 2007 SP1 をインストールしたあとで SSRS を SharePoint 統合モードとして構成しますが、今はまだです。また、SharePoint 統合モードの管理ページや Web パーツが含まれる SharePoint 用の Add-in を後にインストールするのですが、これは必ず PerformancePoint Planning Server の構成よりも 「後に」 インストールします。構成前にインストールしてしまうと、このモジュールが邪魔をして PPS Planning の構成ウィザードが先に進んでくれなくなりますのでご注意ください。 STEP 2: SharePoint Server 2007 SP1 をインストールする SharePoint Server 2007 SP1 をインストールするのですが、以前解説したとおり SP1 適用前の SharePoint Server 2007 をインストールすることができないため、インストール モジュールに対してあらかじめ SP1 を適用しておく必要があります。SP1 適用済みインストール モジュールを作成したら、今回は「完全」 オプションでインストールします。基本インストールにしてしまうと、SQL Server 2005 ベースの Express エンジンがインストールされてしまいますので (実務上困るわけではないですが) ご注意ください。無事にインストールが済んだら、普通にサーバーを構成し、サイトコレクションを 1つ作ってください。 STEP 3: レポートサーバーを SharePoint 統合モードで構成する SharePoint のインストールが完了したら、レポートサーバーを構成します。「Reporting Services 構成マネージャ」 を起動してください。 「サービス アカウント」 は先ほど LOCAL SYSTEM でインストールしていますので、ビルトインアカウントとして “ローカルシステム” を選択し、「適用」 ボタンを押します。 「Web サービス URL」 では、仮想ディレクトリ名を “ReportServer” (もちろん何だっていいですが)、TCP ポートを “8080” (これも何でもいいですが、80 を選ぶと追加設定が必要になるので、どうせ表には出ないポート番号ですからよしておきましょう) にし、「適用」 ボタンを押します。 「データベース」 では 「データベースの変更」 で新しいレポート データベースを作成します。サーバー名は自分、認証の種類は “統合セキュリティ”、次に進んでレポート サーバー モードを “SharePoint 統合モード” に指定し、データベース作成を実行します。その他の項目は設定してもしなくても結構です。 STEP 4: SQL Server 2005 CU9 をインストールする PerformancePoint Server 2007 SP1 は、データベースアクセスのためのクライアント コンポーネントを使いますが、これには SQL Server 2005 のバージョンのものが必要となります。そのため、SQL Server 2005 CU9 に含まれる 4 つのコンポーネント “ Native Client”、”ADOMD.NET”、”ASOLEDB”、”XMO” をインストールします。 CU9 は普通にダウンロードセンターから入手はできず、「リクエスト」することが必要です。マイクロソフトの KB にアクセス し、画面上部の 「この技術情報に対応する修正プログラムのダウンロードのリスト」リンクをクリックすると、許諾画面が表示されるので 「同意する」 を押します。 5 つのモジュールがリストされると思いますが、SQLServer2005_XMO、SQLServer2005_ADOMD、SQLServer2005_ASOLEDB9、Yukon_SP2_CU_SNAC の 4 つにチェックを付け、電子メールアドレスを入れて 「リクエストを送信する」 を押すと、指定したアドレスに、ダウンロード方法のメールが送信されます。 ダウンロードが完了したら、それぞれを展開しインストールします。 STEP 5: PerformancePoint Server 2007 SP1 をインストールする まず PerformancePoint Server 2007 をインストールし、サーバーを構成せずに、立て続けに SP2 をインストールします。SP2 には SP1 の更新が含まれていますので、SP1 は当てる必要がありません。なお、ASP.NET 2.0 AJAX Extension 1.0 のインストールを忘れずに。PPS Monitoring と SharePoint Server が起動しなくなります。 今回このマシンはドメインコントローラーなので、インストーラーのダブルクリックでは OS チェックではじかれてインストールできません。これを回避するには、コマンドラインで msiexec.exe を呼び出し、SKIPOSCHECK=TRUE オプションで実行してやる必要があります。.msi ファイルのインストールは /i オプション、.msp ファイルの更新インストールは /update オプションをつけます。たとえば msiexec /update PPLSrv.msp skiposcheck=true のようにタイプします。これで OS チェックなしにインストーラーが起動し、インストール可能となります。 インストールが済んだら、最初に作ったサービス アカウントを使って Monitoring Server および Planning Server を構成します。詳しい手順はこちらをご参照 ください。PerformancePoint Server SP1 の説明になっていますが、更新モジュールの中身が違うだけでやり方は一緒です。 STEP 6: SQL Server 2008 SharePoint Add-in をインストールする SharePoint 統合モードの際の管理ページと Web パーツが含まれる Add-in (rsSharePoint.msi) をインストールします。普通にインストールすればいいのですが、構成時にエラーが起きることがあります (私自身何度か経験しました)。エラーが起きた場合は 「統合の構成」をやり直す必要があり、これはコマンドラインで行います。全体に時間のかかるプロセスですし、エラーが起きるのも気持ち悪いので、最初から 「ファイルのみのモード」 でアドインをインストールし、別途「統合の構成」 をしたほうがいいかもしれません。トータルの所要時間は変わりません。 ファイルのみのモードでインストールするには、コマンドラインから rsSharePoint.msi SKIPCA=TRUE とタイプします。初めてのインストールでも 「古いバージョンが検出されました」 といわれてしまいますが、「はい」を選択してアップグレード扱いにしてください。そのまま進んでインストールを完了します。 アドインのインストールに成功すると、\Users\(ユーザー名)\AppData\Local\Temp に rsCustomAction.exe が作成されます。これが統合の構成用のコマンドラインモジュールです。コマンドラインから、rsCustomAction /i を実行すると、構成がはじまります。結構時間がかかりますが、がまんしてください。うまくいくと、コマンドラインの最後に “The command completed successfully” と出ます。 うまくいっていたら、「SharePoint 3.0 サーバーの全体管理」で 「アプリケーション構成の管理」 を選択すると、「SharePoint Web アプリケーション構成の管理」の 1つ下に新たなカテゴリ 「Reporting Services」が表示されるはずです。「統合設定の管理」 をクリックし、「レポート サーバー Web サービスの URL」 に Reporting Services 構成マネージャで指定した Web サービスの URL (たとえば http://localhost:8080/ReportServer) を入力、「認証モード」 を “Windows 認証” にし、OK を押します。 STEP 7: Report Builder 2.0 をインストールする これは特にコツなどありません。ただインストールするだけです。レポート サーバーの URL を入力する箇所があるので、ここには先に作った SharePoint のサイトコレクションの URL を入れておきましょう。後で設定してもいいのですが、ここで設定した URL が、データ接続情報などを取りに行く時のデフォルトのディレクトリになります。 STEP 8: SQL Server サンプルデータベースをインストールする サンプルは Codeplex からダウンロードしなきゃいけないみたいです。でも確かにそのほうが理にかなっていますね。ちなみに、SQL Server 2005 のデータベース (RDB も Cube も) をバックアップして、SQL Server 2008 で復元してもちゃんと動きますので、古いのをお持ちならそれを活用してください。 SQL Server 2008 用のサンプルデータベースは このあたり からダウンロードしてください。ひとまず前バージョンでおなじみの AdventureWorks でも入れておきましょう。ただし、これは SQL Server 2005 の時も同じでしたが、サンプルの .msi をインストールしても、リレーショナルデータベースは作成されますが、Analysis Services データベースは作成されません。インストールが終了したら、\Program Files\Microsoft SQL Server\100\Tools\Samples にいくつかサンプルプロジェクトが追加されますので、例えばその中の \AdventureWorks 2008 Analysis Services Project\enterprise\Adventure Works.sln をダブルクリックすると、Business Intelligence Studio が起動しますので、「配置」 により Analysis Services データベースを新たに作成してください。まあまあ時間がかかりますが、BI Studio の右下やステータスバーに、配置が正常に完了した旨のメッセージが表示されたら作成終了です。 STEP 9: ついでに Data Mining Add-ins for Office をインストールする 本題とはあまり関係ありませんが、せっかく Microsoft BI なので入れてみましょう。もちろん、Office 2007 がインストールされていなければ入れても意味はありません。 モジュールのインストールが完了したら、「サーバー構成ユーティリティ」 でインストール済みの SQL Server につなぎ、「一時的なマイニング モデルの作成を許可する」 にチェックを入れ、新しいデータベース “DMAddinsDB” を作成します。新しいデータベースを作成しなくても、配置した AdventureWorks につないでもかまいません。 構成が完了したら、Excel を起動します。最初にダイアログが表示されるので、「自分で管理する Microsoft SQL Server … を使用します」 を選択し 「次へ」、「完了」 ボタンを押します。この状態だとまだサーバーにはつながっていませんので、Excel リボン メニューの 「データ マイニング」 タブを選択し、「接続」 グループの左側のアイコン <接続なし> をクリック、「新規作成」 でサーバー名とマイニング用データベース (“DMAddinsDB” なり “AdventureWorks” なり) を選択し、新しい接続を作成します。 これで一通りの構成が完了しました。あとは SharePoint サイトをどんどん作成し、PerformancePoint を使っていきましょう。 March 13 SQL 2008 DM Add-ins を使ってみよう – 買い物かご分析(ツールのダウンロードは こちら から。また、当然 SQL Server 2008 が必要ですので、お持ちでない方は評価版を こちら からダウンロードしてください) 「買い物かご分析」ツールも、SQL Server 2008 Data Mining Add-ins for Office の Table Analysis Tools に新たに追加された機能です。アルゴリズムとしては、「アソシエーション ルール」を使っています。前バージョンに引き続き Data Mining Client for Excel に用意されている「関連付け」と類似の機能を果たしますが、Data Mining Client for Excel がサーバー上にモデルを構築し SQL Server の API を介してグラフィカルなビューワーにより分析結果を表示するのに対し、この「買い物かご分析」は手軽に実行できる分 Excel 標準機能のみを使ったシンプルな表現を行います。 アソシエーション ルール アルゴリズムについては、以前の連載である程度ご説明済みなので、今回は省略します。では早速、サンプルデータを使ってレポートを作成してみましょう。 Windows スタートメニューの [すべてのプログラム] - [Microsoft SQL 2008 データマイニング アドイン] - [Excel サンプル データ] を開き、「Associate」 シートを選択してください。このシートのサンプルデータはいわゆるトランザクション データで、”Order Number” (注文番号) と “Category” (商品のカテゴリ) や “Product Name” (商品の名前) および “Product Price” (単価) が入った非常にシンプルな構造になっています。POS などの販売実績データを抽出すれば、この程度のテーブルを作成するのは簡単です。テーブルのどこか一部をクリックすると、メニューに「テーブル ツール」が表示されますので、その下の 「分析」 タブにある 「買い物かご分析」 ボタンをクリックしてください。すると、同名のダイアログ ボックスが表示されます。 ここではデフォルトのまま、[トランザクション ID] には “Order Number”、[アイテム] には “Category”、[アイテムの値] には “Product Price” が選ばれている状態にしてください。これで、注文番号である “Order Number” ごとに、同時に購入されるアイテム “Category” と、その 1 回のトランザクションにおける “Category” ごとの購入金額に基づいて分析がなされるようになります。 [詳細設定] をクリックすると、アソシエーションルールに適用可能なパラメーターが選択できます。今回はここもデフォルトでかまいませんが、[最小のサポート] には、同時購買されるアイテムの組み合わせ (アイテム セット) が最低いくつなければならないかを設定します。アイテム セット数が少ない場合、たまたま同時購買されただけかもしれませんが、とはいえ店のレイアウトに問題があるかもしれませんので、単純にこの数を大きくしてはいけません。分析対象となる製品特性や店舗レイアウト、データ量そのものによって調整すべきです。デフォルトは、”10 アイテム” となっています。 また [ルールの最小確率] には、分析対象にする同時併売ルール発生確率の最低値を設定します。この値のデフォルトは “40%” なのですが、これはつまり 「A が購入されたならば B が同時に購入される」 (A → B) といったルールで考えた場合に、A が購入された全てのトランザクションのうち B が同時に購入された割合を意味し、それが “40%” 以上のものだけを表示する、ということです。したがって、これも注意が必要です。たとえば B の販売実績が A と比べてとても大きい場合、この確率は 100% に近くなる可能性が高いはずです。サポートと同じく別の要因が影響を与える可能性もあり、単純に確率だけで足切りはできないということです。なお分析結果を見る場合には、この確率ではなく 「重要度」 が関連性の高さを示す指標となります。 さて、デフォルトのままで [OK] ボタンを押します。すると、「買い物かごのバンドル アイテム」 と 「買い物かごの推奨アイテム」 の 2 つのシートが追加されます。 「買い物かごのバンドル アイテム」 には、抽出したアイテム セット (「アイテムのバンドル」) とそこに含まれるアイテム数 (「バンドルのサイズ」)、アイテム セットの販売数 (「販売数」)、アイテム セットの平均組み合わせ単価 (「販売ごとの平均値」)、その販売数と組み合わせ単価の掛け算でもあるアイテム セットの合計金額 (「バンドルの総数」) が表示されます。 このシートはあくまで分析の基礎データなので、インタラクティブな分析をするには次のシートの 「買い物かごの推奨アイテム」 シートを使います。 このシートはその名の通り、レコメンデーションのためのツールとなります。表示されているテーブルの最初の列 「選択したアイテム」 は、「A → B」 の関係における A にあたるアイテムを指します。2 番目の列 「推奨」 は B です。「選択されたアイテムの販売」 は A が販売されたトランザクション数、「関連付け販売」 は 「A → B」 となったトランザクション数を示します。したがって 「関連付け販売の割合」 は、「関連付け販売」 ÷ 「選択されたアイテムの販売」 となります。6 列目の 「推奨アイテムの平均値」 は A → B となる場合のトランザクションあたり B の平均単価を示しますので、7 列目の 「関連付け販売の総数」 は 「選択されたアイテムの販売」 × 「推奨アイテムの平均値」 であり、関連付けにより販売される推奨アイテムの合計販売金額となります。 今回のサンプルではあまり多くのアイテム セットが抽出されませんので、このシートでインタラクティブな操作をしても実感がわきづらいですが、たとえばアイテム セットが多い場合はフィルタを使って、たとえば関連付け販売の割合の高いものに絞り込み、選択したアイテムの割引キャンペーン実施や、逆に推奨アイテムの単価を上げることで収益を拡大できるかどうかを検討したり、あるいは単価の高い推奨アイテムに絞り込み、関連付け販売の割合を向上させられないかを検討したりすることができます。 Data Mining Client の 「関連付け」 とは異なり視覚的なダイアグラムなどは表示されませんが、とり回しの簡単な Excel テーブルとして表現されますので、表の集計や視覚表現の追加、ピボットグラフの作成など Excel の標準機能を駆使した分析を、簡単に繰り返して実行できます。データ マイニングの多くは、分析を始めるにあたっての仮説構築のために使うものですから、自動抽出した仮説をそのまま Excel で加工でき、しかもそれをスピーディに繰り返して実行できるというのは、非常に大きな魅力です。 February 18 SQL 2008 DM Add-ins を使ってみよう – 予測計算 (2)(ツールのダウンロードは こちら から。また、当然 SQL Server 2008 が必要ですので、お持ちでない方は評価版を こちら からダウンロードしてください) 前回の続きです。 2. 「Purchased Bike の予測計算」 次に、「Purchased Bike の予測計算」 シートを見てみましょう。上部に「利益を最大化するために推奨されるしきい値」が表示されていますが、これは前の 「Purchased Bike の予測レポート」 で算出された最適なスコアと同じものです。 その下のテーブルには、すべての入力列と、それぞれがとる値、およびその相対的影響度スコアが表示されています。値列を変更すると、それぞれの入力列のスコアが変化し、合計スコアが変わります。このテーブルで計算される合計スコアが、最上部のしきい値となるスコアを超えている場合には真陽性となりますので、「’Yes’ の予測」 は “TRUE” と表示されます。逆にしきい値のスコアを下回ってしまう場合は “FALSE” と表示されます。 つまり、このシートは、上部のテーブルをインタラクティブに操作することで、その属性を持つ顧客が自転車を購入するかどうかを予測するためのもの、であり、これ自体が一種のマイニング モデルとも言えるのです。このモデルに新たなデータを投入 (属性の値を変更) することで、”Purchased Bike” が “Yes” となるかどうかが予測できます。 たとえば来店した顧客が、独身 (スコア 34) の女性 (8) で収入 $39K-71K (62)、子供 5 人 (0) で大学卒 (63)、専門職 (70) で持家なし (37)、車を 2 台所有 (85) しており通勤距離は 5-10 マイル (9)、北米に住む (0)、37-46歳 (23) である場合、テーブル上の値フィールドをそれぞれそのように変更してみると、合計スコアは “391” となり、しきい値の “469” を大きく下回るため、この顧客は恐らく自転車を買わないでしょう。もしこの顧客の通勤距離だけを 0-1 マイルだったとすると、この属性のスコアは “121” になり、合計スコアはしきい値を上回るようになります。通勤距離が近い人は、都心部に住んでおり、会社まで自転車で通ったり、より健康に気をつけたり、というような理由なのでしょうね。
3. 「Purchased Bike の印刷可能な計算」 最後のシート 「Purchased Bike の印刷可能な計算」 は、先の予測計算のオフライン版です。このシートにはすべての入力と取りうる値、それぞれのスコアがすべて表示されています。PC を使えない環境の場合は、このシートを印刷しておけば、該当する値のスコアを手で合計することができるというわけです。でも、単なる計算シートとして活用するだけでなく、先ほどの例での 「通勤距離」 ごとのスコアの違いのように、各属性値が売上予測に与える影響を一望できるというメリットもあります。販売実績管理システムなどから定期的にこのような顧客属性データを引っ張り出し、スコアカードを作っておくと、顧客マインドをよりつかみやすくなるのではないでしょうか。 次回は、Table Analysis Tools に追加されたもう 1 つの新機能 「買い物かご分析」 について解説します。 February 10 SQL 2008 DM Add-ins を使ってみよう – 予測計算 (1)(ツールのダウンロードは こちら から。また、当然 SQL Server 2008 が必要ですので、お持ちでない方は評価版を こちら からダウンロードしてください) 「予測計算」 ツールは、SQL Server 2008 Data Mining Add-ins for Office の Table Analysis Tools に新たに追加された機能です。アルゴリズムとしては、「シナリオ分析」 と同じ 「ロジスティック回帰」 を使っています。ロジスティック回帰については、SQL Server 2005 Data Mining Add-ins の連載時にはさらっとしか触れておりませんでしたので、ここでもう少しご説明しておきます。 このアルゴリズムは、ロジスティック曲線と呼ばれるS字型のカーブのグラフを使って予測をするものです。たとえば、ある離島に住むネズミの増殖を観察した場合に、X 軸 (横) を時間、Y 軸 (縦) をネズミの数とすると、最初はゆるやかに個体数が増えていきますが、やがていわゆるネズミ算式に爆発的に個体数が増えだし、そしてある一定数を超えると食料が不足するため個体数は頭打ちになっていく、というような曲線を描くことになりますが、このような線をロジスティック曲線と言います。グラフ上は、Y の最小値が 0、最大値が 1 だとした場合に、X が 0 に近いときには Y も 0 に近く、X の中心近くで急に Y が 1 に近づき、それ以降は X が大きくなっても Y は 1 近くに張り付いたままになります。なお回帰式としては、X が 1 種類の単回帰だけでなく、複数の入力値を使った重回帰にも対応します。つまり、分析対象となる予測可能列が 0 か 1 の値をとるような場合、あるいは幅に制限がある場合に適したアルゴリズムなのです。 そして、各入力列はとりうる値の種類や幅も異なることから、「Z スコア正規化法」 を用いてスコア化することでそれらを平準化し、予測可能列に与える影響度を比較できるようにします。いわゆる Z 検定ということですので、標本と母集団の平均の差異のバラツキを測定しているわけですが、つまりこのスコアが大きいほど 「ランダムな状態ならめったに起きないはず」 の事象、であることを示し、すなわち予測可能列に対して与えるインパクトが大きいとみなされます。ただし、この値はあくまで同一回帰式における相対的な大きさを示すものであり、別の式で算出されるスコアと比較はできません。 さて、予測計算ツールではこのロジスティック回帰を使っているため、各入力列の値に対してスコアが割り当てられます。このスコアが高いほど、その入力列は予測結果に対するインパクトが大きいということが分かります。さらに、利益チャートのように最大の利益をもたらす時のスコアが算出できるため、入力列の値の組み合わせを変えた場合に予測結果がどのように変化するかをシミュレーションすることもできます。 早速、サンプルデータを使ってレポートを作成してみましょう。 Windows スタートメニューの [すべてのプログラム] - [Microsoft SQL 2008 データマイニング アドイン] - [Excel サンプル データ] を開き、「Table Analysis Tools Sample」 シートを選択してください。このシートはいわゆる顧客情報テーブルで、既婚/未婚、性別、収入などの個人プロファイルと、その個人がPurchased Bike (自転車を買ったか買っていないか) を示すフラグが入力されています。表のどこか一部をクリックすると、メニューに [テーブル ツール] が表示されますので、その下の [分析] タブにある [予測計算] ボタンをクリックしてください。すると、同名のダイアログ ボックスが表示されます。 [列の選択] – [対象] では最後の列の “Purchased Bike” を選び、その下の [直接指定] では “Yes” を選んでください。これで、「自転車を買う人」 がどのような属性の人なのかを分析することができるわけです。 さらに、[分析に使用する列を選択してください] をクリックし、入力列を選択します。このとき、入力列の選択には十分な注意が必要です。デフォルトでは外れるようになっていますが “ID” 列のような分析にとって意味のない列や、”Purchased Bike” のような予測可能列自身を入力列にしないようにします。また今回のサンプルデータにはありませんが、”年齢” と “世代” のように、意味の類似する列も除きます。予測計算では、先に説明したスコアにより入力間の相対的な影響度を測定しているため、入力列が増えれば当然ならがそのスコアの大きさが変わってしまうためです。なお、出力オプションはデフォルトのまま、両方ともチェックボックスを付けておいてください。 [実行] ボタンを押します。すると、「Purchased Bike の予測レポート」、「Purchased Bike の予測計算」、「Purchased Bike の印刷可能な計算」 の 3 つのシートが追加されます。 1. 「Purchased Bike の予測レポート」 このシートには、ロジスティック回帰による分析結果が表示されます。このレポートでは、予測が的中した場合の利益とコスト、予測が外れた場合の利益とコストをもとに、合計利益の最大化をするスコアを算出します。このスコアは次の 「予測計算」 シートで使われます。 左上には、単位当たりのコストと利益を入力するセルがあります。「偽陽性」 「真陰性」 などの見慣れない単語がありますが、最初の 「真」 「偽」 は予測結果が実際に正しかったか間違っているかを表し、次の 「陽性」 「陰性」 は予測結果そのものを表します。今回の場合ですと、”Purchased Bike” が “Yes” であることを予測しようとしていますので、「偽陽性」 とは、”Purchased Bike” が “Yes” だと思ったのにハズレだった、ということを意味します。ですから 「偽陽性のコスト」 とは、ここでは、たとえば自転車を買いそうだと思って DM を出したけど買ってくれなくて無駄になった顧客当たりの DM 費用、のようなものを入力しておきます。 デフォルトでは 「偽陽性のコスト」 に “10”、「真陽性の利益」 に “10” がセットされています。単位は何だっていいわけですが、円だということにしておいて、ひとまず 「偽陽性のコスト」 を “1,500” 円、「真陽性の利益」 を “2,500” 円としておきましょう。たとえば DM 1 通あたりの制作費および郵送費が 1,500 円、それにより商品が売れた利益 (もちろんコスト差引後) 総額を販売顧客の頭数で割ったものが 2,500 円、というようなことを意味します。すると、当初と比べて右上のグラフの形が変化するとともに、「利益を最大化するために推奨されるしきい値」 の値も変化します。 このしきい値が 「スコア」 の合計であり、同じレポートの下のほうに別の表があるのですが、ここから取得して計算しています。その表または右上のグラフをご覧いただければ分かるのですが、スコアが “469” 以上の顧客をターゲットとするときに、利益は最大化され 174,500 円となります。スコアが低すぎる顧客をターゲットにするとハズレが多くなるためコスト上昇のほうが大きくて合計利益は上がりませんが、逆にスコアが高すぎる顧客をターゲットにした場合も、予測精度が上がるためハズレは減るのですが、予測される真陽性の数も一定の割合で減ってしまう (偽陰性が増える) ため、合計利益は減っていくのです。 上から 2 つ目のグラフは、累積コストを示します。今回は偽陽性のコストのみ設定していますので、スコアが高くなれば予測精度が上がりますから、コストは右肩下がりになります。お試しいただければ分かりますが、もし偽陰性のコストも設定した場合は、ここに右肩上がりの系列も追加されます。そのようなコストが存在する場合は、コストバランスが利益チャートの形に影響を及ぼすわけです。 このように、「予測レポート」 ではまず利益・コスト計算のためのパラメーターを与え、最適なスコアを算出するのが目的となります。 ちょっと長くなりましたので、あと 2 つシートが残っていますが、今回はここまでとします。 インフォメーションワーカービジネス本部 米野 January 14 PerformancePoint Server 2007 Service Pack 2 が公開されました本日 Office PerformancePoint Server 2007 の Service Pack 2 が公開されました。Hyper-V や SQL Server 2008 への対応、バグフィックスなどが含まれています。詳細は http://www.microsoft.com/japan/office/2007/performancepoint/download.mspx をご参照ください。なお、現時点ではインストールモジュールのみが日本語化されており、Readme はじめ関連ドキュメントについてはまだ英語のままとなっています。これらの日本語版提供は 2月上旬を予定しています。 |
|
||||||||||
|
|