2013年12月28日土曜日

これからデータ分析を始めたい人のための本

ニューヨーク市で統計ディレクターとして政策立案に携わっていた著者(*現アクセンチュアアナリティクス日本統括)による、データ分析プロジェクトについての手引き書。

データサイエンティストという存在のバズワード化と共に手段の目的化を誘発しかねないテクニカルなデータクランチングに重きを置いた書籍が氾濫する中、本書はデータ分析によって解決すべき経営課題の見極めやモデル構築後の業務運用設計の重要さを強調しており、現場に則したより実践的な内容となっている。

データサイエンティストというロールには経営課題/オペレーション/データ抽出に必要なシステム基盤/統計的解析手法/解析ツールこれら全てについての知見が必要となるが、全てを理解している超人的に有能な人材の登場を待つのではなく、それぞれの分野に精通した人材を集めたプロジェクトチームを組成することでファンクションとして構築すべきという論旨は、非常に現実的な考え方で腹落ちすることができた。

データ分析プロジェクトのアプローチと主要論点が網羅されており、一読すれば関連プロジェクトの骨子を掴むことができる。主に以下の5つのステップで構成されるとのことだが、網羅性も具体性もあり非常に参考になる。

1.チーム編成
・メンバー選出
・リーダーシップの確保
・自社対応範囲の見極め

2.狙いを定める
・経営課題の定義
・課題の優先順位付け
・プロジェクトスコープの定義
・仮説立案
・分析結果の活用目的の明確化
・データの前処理(抽出・集約・変換)
・データ調査
・システム基盤の調査

3.データ解析
・モデル構築用のデータ移行
・変数補完・変数選択
・非構造データの構造化
・探索的データ解析、仮説の見直し

4.モデリング
・構造化データの基本統計量分析
・数理モデル選定/構築/評価

5.運用の最適化
・展開方法策定(組織/人事設計)
・IT機能要件/非機能要件定義
・データ活用業務の最適化/評価
・モデルの最適化と精度評価
・改善投資計画の承認と指示

これからデータ分析を始めたい人のための本これからデータ分析を始めたい人のための本
工藤卓哉

PHP研究所  2013-11-23
売り上げランキング : 1211

Amazonで詳しく見る
by G-Tools

0 件のコメント:

コメントを投稿