現場でデータサイエンスはどのように活用されているのか

「現場でデータサイエンスはどのように活用されているのか」。
このことはとても興味があります。
統計解析は、予測なので、実行が伴わなければ単なる評論に過ぎません。
企業での活用には様々な壁があり、決裁権者の理解、チーム作り、活用方法など解決しなければならない課題が多くあります。

そういうことで、こんな記事を発見したので備忘しておきます。
元々学問的に深い理解をしている人たちがやっているので、私のようなにわか統計家志望には参考にならないかといえば、元も子もないので記録として取っておこうかと思います。

IT Leaders「リクルートはいかにしてデータサイエンスを駆使するか

需要予測に基づく広告宣伝費のポートフォリオの最適化

広告費の最適化モデルは挑戦したい分野。広宣費のポートフォリオは弊社の場合あまり意味を成さない感じですが、現場レベルで調整は可能なので試してみたい。

何らかの数理モデルを用いて、テレビコマーシャルやWebの広告、検索キーワードなどに連動して表示されるリスティング広告の出稿割合を決める。

これは面白い。でも出稿割合を変動させるほど出稿してないからなぁ。広告のクリエイティブを変動させるのは面白いかも。

予約の件数に応じて収益が増えるじゃらんのような従量課金型のビジネスと違って、住宅情報は広告枠を販売するビジネスなんです。どちらかと言えば、前者はコンバージョンの最大化が求められ、後者は広告主であるお客様と合意した成果と、それを達成するのに当社が投じる広告宣伝費との均衡点を導き出すことが求められます。

じゃらんのビジネスモデルは、そーなのかぁと思う程度だけど、後者の成果を達成するための広告宣伝費の均衡点という考え方は参考になった。

専門知識ゼロで使えるよう独自ツールで予測自動化

これは理想! 専門家がゴニョゴニョやってジャーンって出すのは作ってる方はわかるけど相手がわかってない分フェアじゃない気がするので、こういう予測自動化ツールの開発はやってみたいなと思います。バックグラウンドの仕組みは結局ゴニョゴニョやってるので、このゴニョゴニョの式をもっと簡易化して高校レベルの数学で理解できる数理モデルで実現させたい、と。

統計解析言語の「R」を使って独自開発

Rは取り回しが利きやすいツールだし、開発にはもってこいのツール。独自モデルの構築に使えることがわかって良かった。

当時は米SPSS(現、米IBM)のデータマイニングツール「Clementine」と、数理システムの数理計画ソフト「NUOPT(ニューオプト)」を組み合わせてシステムを開発

SPSSはまだ踏み込んでいない領域だけど、いずれ踏み込みたい。Clementineはちょっと興味ある。

現在はレコメンド対象の会員を拡大するため、より大容量のデータを扱える「Hadoop」でデータマイニングの基盤を構成

レコメンドプログラムは、直近の課題としたい。統計解析威力のプレゼンテーションにもってこいのネタ。

ひとまず現場の最前線では壮大なことが実践されていることがわかった。
壮大なことをいきなりやれるスキルが私自身ないし、チームの経験値も十分ではない。
高校生レベルの数理モデルで簡易的に始めるのが現実的な感じがしないでもないなぁ。

Leave a Reply

%d人のブロガーが「いいね」をつけました。