情報活用の先駆者に学ぶ、競争優位に立つデータ基盤とは?:Informatica World Tourレポート
インフォマティカ・ジャパンは10月31日、“Return on Data”をテーマに、データの真の価値を引き出すためのデータマネジメントにスポットを当てたセミナーを開催した。同セミナーでは、楽天やNECが取り組むデータ活用施策に加え、企業のデータ活用支援ツールである同日発表された「Informatica 9.5」の特徴などが紹介された。
顧客データを集約したDWHで現場業務を側面支援
「インターネット上のショッピングモールを中核に、金融やトラベル、ポータルなど、楽天が手掛ける事業は多岐にわたる。我々の強みは、統一の会員IDとパスワードを基に、あらゆるサービスの一元的な把握と分析を可能にする“楽天スーパーデータベース(楽天DB)”だ」
インフォマティカ・ジャパンは10月31日、「Informatica World Tour」と題したセミナーを開催した。楽天のグループ・コア・サービス部で部長を務める景山均氏は“Return on Data”、すなわち、データの価値を最大限に引き出す手法について焦点を絞ったセミナーの基調講演に登壇。その冒頭で、同社の急成長における“秘密”をこう明らかにした。
楽天の事業の肝とも呼べる楽天DBは、会員属性や購入履歴、各種のアンケート結果、クーポン、カード情報など、顧客に紐づけられたあらゆるデータを集約管理するデータウェアハウス(DWH)である。楽天の分析担当者はそこに格納されたデータ解析を通じて、まず顧客を数百もの“クラスタ”に分類。その上で、クラスタを数十程度に集約することで、メールマガジン配信やコンテンツの編成など、データにあまり精通しない、幅広い部門の業務支援に役立てているのだという。
なお、楽天では事業部ごとにさまざまなデータベースを採用。楽天DBはそれらと連携して機能するが、ELTツールにはインフォマティカの「Informatica PowerCenter」が採用されている。「PowerCenterには多様な連携用アダプターが用意されており、接続先を意識することなく作業できる」(景山氏)ことがその理由で、データ連携コストを確実に削減できているという。
ビッグデータで顧客の遷移を俯瞰的に把握する
分析結果の活用方法は極めて多彩だ。楽天のWebサイトでは多くのスペースがパーソナライズされており、それらに表示されるコンテンツをクラスタなどを利用して出し分け。また、メール配信エンジンシステムと連携し、顧客別にセグメント化されたメール配信にも活用されている。例えば、ゴルフ場予約・検索サービス「楽天GORA」の利用経験のある顧客に対して、バナー広告を意図的に掲載し、再度の利用を呼び掛けることができる。
「楽天DBを核に多様なサービス間で顧客を呼び込みあう。これこそ、我々の描く楽天経済圏の確立という事業戦略そのものだ」(景山氏)
楽天に新たに蓄積される顧客データは、1日あたり数百ギガバイト以上にも達するほどだ。ただし、分析コストや時間の制約から、従来、活用できるデータは決して多くはなかったという。だが、バッチ処理の短期化を目的に導入したHadoopプラットフォームを流用することで、そうしたビッグデータの活用にも着手した。
「顧客の動きを詳細に把握できれば、各サービスでの顧客遷移の俯瞰的な可視化も可能になり、全く新たな打ち手が見つかる可能性も決して小さくない」(景山氏)
同社では来年に向け、ビッグデータの解析結果を基に顧客とのタッチポイントをさらに拡充していく。
データ活用に向け留意すべき3つの技術
続いて登壇したのは、米インフォマティカ 副社長 ビジネス開発担当のマイク・ピケット氏だ。同氏は「情報は利益拡大とコスト削減の双方において極めて大きな意味を持つ」と強調する。
ある金融機関の事例を基に見てみよう。利益拡大については、バックエンドで個別管理されていた情報の統合により、ファイナンシャルアナリストが顧客情報を一元的に入手可能な環境を作る。その結果、顧客への接客時間が倍増し、売り上げを高めることが可能となった。コスト削減については、不要になったデータを的確に見極めて退避させることで、3年間で1億ポンド(約127億6400万円)のデータ管理コストの削減を可能にしている。
ただし、企業がそれらのメリットの具現化に取り組む上では、“クラウド”と“ソーシャル”、“モバイル”という3つの技術によってもたらされる変化に注意すべきとピケット氏は提言する。
「SaaSの登場以来、そのコストの安価さからオンプレミスシステムのクラウド移行が急速に進んでいる。また、ソーシャルの登場により、多様な相手との相互かつ頻繁なデータのやり取りが広がり、スマートフォンなどモバイル端末の種類も多様化する一方だ。これは、データを取り巻く環境がその姿を大きく変えつつあることを意味する。データ活用にあたってはそのことを念頭に入れた仕組みの整備が強く求められる」(ピケット氏)
多様なデータ統合を実現するInformatica Platform
こうした“変化”への対応を支援する製品としてピケット氏が披露したのが、複数データの統合などを通じてデータ活用を推進する「Informatica 9.5」だ。同製品はデータ連携を中核に、データの品質向上やマスターデータ管理、データのライフサイクル管理などを目的にしたツールによって構成される。
ピケット氏は企業での組織横断的なデータ活用を阻む最大の原因として、サイロ化したシステムやクラウドでデータが分断管理されていることを指摘する。
「それらを統合できて初めてデータの価値を最大化できる。データ管理のためのあらゆる機能を実装したInformatica Platformであれば実現可能だ」(ピケット氏)
例えば、東芝アメリカビジネスソリューションは既存システムをクラウドで刷新。だが、当初は可能だと思われていたメンテナンスや保守、リース、サービスコールなどの情報の統合管理が現実的には難しく、顧客対応の高度化が経営課題となっていた。この問題を克服すべく同社はInformatica Platformを採用。独自に実施した場合には約6カ月を要すだろうと見込まれていたデータ統合作業を約1週間で完了させたという。
ビッグデータの利用やクレンジングにも配慮
インフォマティカは、Hadoopなどのビッグデータ対応も強化する。ソーシャルメディアやモバイル、センサ機器などで生み出される膨大な情報を取り込み、オンプレミスやクラウドを問わず分析することで、互いの相関関係の可視化することも可能だ。
米国で幅広くカジノを運営する、とある企業は、顧客のロイヤリティを高めるために、この特徴に着目。マスターデータ管理の仕組みと連携させることで、ソーシャルメディアへの書き込みを基に、飲み物をサービスや、施設の利用動向の把握などに役立てているという。また、北米でトラック輸送業を展開するUSエキスプレスは9000台のトラックにセンサを設置。Informatica Platformによってアイドリング時間やエンジンの温度、走行ルートなどのデータを収集・分析することで、燃料費だけで年間600万ドルも削減したという。これも、「ビッグデータの利用を通じ、新たな視点での気付きが得られた」(ピケット氏)たまものと言える。
一方で、データ分析の課題として長らく指摘されてきたのが、データ分析の精度を高めるためのデータクレンジングだ。これは分析に関する知見やノウハウが必要とされるため、「業務の15%は手作業に頼らざるを得ず、管理コストの削減に向けた壁になっていた」(ピケット氏)。だがInformatica Platformは、品質維持のための定義を基に、そこから外れるデータに関してアラートを発するデータスチュワード機能を新たに実装。併せて、テキスト解析処理を通じて、言葉の意味を学習させる機能も搭載するなど、多角的な機能強化が図られている。
データによって現場業務の直接的な支援も実現
ピケット氏の講演を引き継いだのが、インフォマティカ・ジャパン セールスコンサルタント部長の山口雄史氏である。同氏は、「Informatica Platformの製品コンセプトである“Return on Data”は、極めて壮大なビジョンであり、現場の社員には理解しにくい面もある」と前置きした上で、「実はInformatica Platformは現場を直接的に支援する身近な機能も数多く実装していること」を強調。代表的な利用シーンとして、システム刷新のためのデータの棚卸しを紹介した。
システム移行とデータ移行は現実的に不可分の存在である。ただし、業務の見直しに併せてシステムに継続的に手を加え続けたことで、システムがいわゆる“ブラックボックス化”しているケースも散見される。こうした中、移行を進める上で、システムのどこに、どんなデータが、どのような形式で格納されているかを改めて突き止める作業が不可欠だという。しかし、従来はこの作業がプロジェクトの長期化とコストの肥大化を招いていたのである。
こうした問題を解決する製品がデータ品質管理ツール「Informatica Data Explorer」である。同製品は、ブラウザベースのGUIによって、データを簡単にプロファイリングするとともに、データの継続的な監視を実現する。そのメリットについて、山口氏は次のような環境でのシステム移行を例に話を進めた。
- 長年にわたり手を加えられてきた営業系システムの刷新
- 変更管理が徹底されておらず、変更後の仕様書が存在しない
- 入力すべきデータが機能ごとに統一されていない
- システムを確認したところ、当初には存在しなかった「業種マスター」が追加されていた
データをパターン分類し短期間でクレンジングを実施
このような環境で作業を進める上で、最初に着手すべきことは、各マスターデータの構造と各マスター間の関係性の把握である。これによりシステム全体のデータ構造を俯瞰的に把握でき、システム全体の複雑なデータの流れも可視化できるようになるからだ。
そこで力を発揮するのが、Data Explorerのプロファイリング機能。同機能によって、DBに格納されているテーブル間の関係性を簡単なクリック操作だけで階層構造で確認できる。
「その結果、会社マスターのプライマリーキーと顧客マスターの会社IDが紐付けられていることなどが特定できる。さらに一歩踏み込み、各データ間の関係の強さもGUIにより視覚的に把握できる。これらを基にすれば、顧客マスターの地域IDはすべて地域マスターに格納され、顧客マスターの顧客と業種マスターの顧客には重複部分があるといった詳細が確認できる」(山口氏)
顧客マスターを詳しく見ると、そこには郵便番号や顧客名、住所などが格納されている。Data Explorerを利用すれば、それらのデータに含まれる誤りも速やかに検出することが可能だ。例えば、郵便番号や顧客名の入力の際に、“−”の代わりに“ー”を用いたり、姓と名の間にスペースを入れるかどうかが統一されていないといった表記のぶれが存在することも少なくない。対して、Data Explorerはこうした文字や記号をパターン化、それぞれにデータを分類し、違いを明らかにすることで、人の目では見つけにくい誤りの発見を支援する機能を備える。
「また、容易な操作で簡単に(“ー”や“−”など似たような)パターンの違いをクレンジングする機能も搭載されている。今年末にリリースを予定している日本語版では、住所の分かち書きにも対応予定。各マスター間でのデータの整合性を取り、顧客名と業種名を組み合わせることで、すべてのデータを網羅的に把握できるといった気付きも得られる」(山口氏)
多様な切り口からデータを深堀り
また、マスターデータ管理ツール「Informatica MDM」を活用すれば、ビジネス要件に併せたマスターデータの柔軟な管理も実現できる。例えば、入力誤りによって同一の顧客が複数のIDで管理されている場合、ドラッグ&ドロップ操作でIDの統合が可能。また、GUIによる容易な操作で会社名や顧客名、担当営業など、多様な切り口から関連データの確認方法を変更し、データの深堀りも実現できる。
「データの“見える化”を推進することで、効果的な経営の意思決定が可能になる。今後、この領域に対する企業の関心が急速に高まるはずである」と山口氏は強調。他社との差別化のためにも、いち早くそのための仕組みを整備することの必要性を訴えた。
ビッグデータの活用を多様な側面から推進するNEC
セミナーの最後を飾ったのが、NEC 執行役員 ITサービスビジネスユニットの龍野康次郎氏の特別公演だ。同氏によると、近年の技術革新の中でも社会に最も大きな影響を与えているのがスマートデバイスの登場やセンサー技術の発達だという。事実、スマートフォンはその使い勝手の高さなどが評価され、グローバルでの出荷台数は2012年の3億6800万台から、2015年には約10億台に達するとの予測もあるほど。また、従来型の電力ネットワークの見直しなどのために、各種センサーの活用も着実に進んでいる。
その結果、社会にもたらされているのが、いわゆる“データ爆発”である。グリーンIT協議会では、2025年にやりとりされるデータ量を2006年の200倍と予測。龍野氏によると、それらのほとんどは有効活用されていないのが実情のようだ。
「社会で流通する情報の99%以上は活用されていないとの集計もある。企業にとって競争力のあるオペレーションコストの構造と、ビジネスのスピードを上げるためには、データは生命線。とりわけ市場の成熟により消費者の嗜好が多様化する中にあって、商機を確実にものにするためにも、SNSなどのビッグデータの活用は不可避である」(龍野氏)
データマネジメントへの取り組みの一つ、ビッグデータの活用は、次の4段階を経ると龍野氏。データを「収集」し、目的に応じて「加工」し、その「分析」を通じて、ビジネスにおける新たな「価値創造」につなげるわけだ。NECでは企業のビッグデータの活用を支援すべく、多様なソリューションを提供。店舗のカメラで撮影した映像を基に顧客の性別や年齢を類推し、POSデータや天候情報などと組み合わせて分析するシステムもすでに開発を終えている。
併せて、同社では2012年7月から企業のデータ活用を支援するためのコンサルティングサービス「ディスカバリープログラム」を開始。同サービスは、顧客企業のビッグデータ活用の狙いや目的を明確化する「ビジョニング」から、“仮説シナリオ”を立案する「データ活用仮説立案」、実データを使った「データ分析検証」までをサービスとして提供。データ活用の重要性の高まりを受け、すでに10社以上で活用が進められている。
「ビッグデータの活用領域は幅広い。現段階ではビッグデータの“高速処理”に焦点が絞られがちだが、データの加工を通じたシステム制御の自動化、さらにデータ間の関係性の発見を通じた新ビジネスの創出にもつなげることができる。社内で育成してきたコンサルタントを活用することで、我々は多様な側面から企業のデータ活用を支援する考えだ」(龍野氏)
インフォマティカと連携し企業のシステム移行を支援
NECは2012年7月からビッグデータ活用に関するコンサルティングサービス「ビッグデータディスカバリープログラム」の提供を開始。この分野への対応も先進的に進めている。すでに約10社から問い合わせが寄せられており、「ビッグデータの活用ビジョンのデザインからシナリオ立案、業務運用までを顧客と共同で推進する」(龍野氏)という。
企業のデータマネジメントを支援すべく、インフォマティカ・ジャパンとの協業も2012年7月に表明。PowerCenterによるシステム移行サービスをサービスメニューに追加した。
「PowerCenterを試したところ、新入社員が30代社員と変わらぬ成果を上げられたことには驚かされた。その利便性の高さは明らかだ」(龍野氏)
「データの活用を抜きに企業が生き残ることはもはや困難。だからこそ、さまざまな角度からデータの価値を引き出すための仕組みの整備が企業にとって急務となっている」と龍野氏は強調し、セミナーを締めくくった。
■この記事に関連するホワイトペーパー
「Return on Data」というコンセプトを基に、重要なデータの価値を最大化させることで収益の向上、さらにはデータの管理コストを削減するソリューションとは
■この記事に関連するホワイトペーパー
Informatica9.5が実現する収益性拡大とコスト削減
2012年10月31日に行われたインフォマティカ・ジャパン主催セミナー「Informatica World Tour−Return on Data データの真価を引き出せ」の講演資料を公開
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
関連リンク
提供:インフォマティカ・ジャパン株式会社
アイティメディア営業企画/制作:ITmedia エグゼクティブ編集部/掲載内容有効期限:2012年12月25日