ITシステム基盤構築に特化し、多彩なビジネスを展開する NTTデータ先端技術にビッグデータの可能性を聞いた

インタビュー
ITシステム基盤構築に特化し、多彩なビジネスを展開する NTTデータ先端技術にビッグデータの可能性を聞いた

NTTデータ先端技術は、公共・金融などの分野の大規模企業ユーザー向けに、ITシステムのミッションクリティカルな基盤を提供するSIerだ。数多いNTTデータのグループ企業の中でも、社名にあるように、絶えず最先端の技術にチャレンジするプロフェッショナルな技術者集団として知られる。
NTTデータ先端技術のビッグデータ基盤ビジネスを率いる小山哲平氏に、他社に抜きんでた技術力の根拠と、同社ならではのビッグデータ・ソリューションの導入スタイルを聞いた。

NTTデータ先端技術が注力する2つのビジネスドメイン

NTTデータの100%出資子会社、NTTデータ先端技術はITシステム基盤領域に特化して先進的な技術と豊富な経験を提供できるSIerだ。同社でいう「ITシステム基盤領域」は実は幅広い。下位レイヤーではネットワーク、ストレージ、サーバーだけでなく、ファシリティや電力も含まれる。

さらに、OS、仮想化、ミドルウェア、アプリケーション基盤などの上位レイヤーもカバーする。その全体に渡ってオンプレミス/クラウド両方の構築実績を持つ。

ITシステム基盤構築に特化しながらも同社のビジネス展開は多彩で、現在は主に2つのドメインに注力する。一つは、製品・サービスの販売を軸にビジネスを展開するプラットフォームビジネスだ。

ここには、ワークスタイル変革を目指すためのセキュアDMZ基盤、運用コストと負荷低減を目指す運用自動化ソリューション、さらにOracle Cloudなど各社製品を活用したクラウドコンピューティングなどが含まれる。

二つ目は、各技術分野のソリューション提供や技術支援を軸にビジネスを展開するソリューションビジネス。ビッグデータ分析基盤構築や機械学習コンサルティングはここに含まれる。さらに、セキュリティに関する診断、コンサルティング、ソリューション提供を目指すセキュリティビジネスも注力分野の一つだ。

ビッグデータの活用は、何がネックになっているのか

今回は、ソリューション事業本部でビッグデータ基盤担当を率いる小山哲平氏に、日本企業のビッグデータ活用の現状とそれに対するNTTデータ先端技術の基本的なアプローチについて話を聞いた。


▲NTTデータ先端技術株式会社 ソリューション事業本部 第二ソリューション事業部 ビッグデータ基盤担当 課長 小山哲平氏

NTTデータ先端技術のビッグデータ基盤担当の基本的なミッションについて述べる前に、小山氏は日本企業のビッグデータ活用の現状についてこう話す。

「私たちの顧客はどちらかといえば、金融、電力、医療といった社会のインフラを支える企業が多いのが特徴です。それらの企業は膨大なデータを持っているのですが、必ずしもデータの利活用が進んでいるとはいえない現状があります。何がネックとなっているのか、その課題解決から入ることが多いですね。

例えば、ECビジネスを展開する顧客から『データ分析を基にして、ユーザーに商品をレコメンドする機能を加えたい』という要望があったとします。たしかにレコメンド機能の導入で売上げは上がるかもしれません。しかし、果たしてそれでいいのか。売上げ増大よりも、むしろ見えない無駄を排してコスト削減を進めた方が事業収益は上がるのではないか。そういったビジネスの根本に立ち返って最適解を提案していくことが多いんです」

一見、そうした根本的なビジネス課題に向き合うのはコンサルティングファームの役割で、IT基盤構築特化を標榜する同社には似つかわしくないのではないかと思えるのだが、そうではない。顧客の表向きの要求の背後にある真のニーズを明確にするのでなければ、そのニーズを満たす最適なIT基盤は構築できないという考え方が、同社には根づいているのだ。

さらに小山氏は話を続ける。

「AIやビッグデータへの期待は高まる一方ですが、分析基盤なしでは夢の話に終わりがち。そもそもビッグデータという言葉一つとっても、その定義は使い手ごとに違っていて、曖昧なまま流通しています。“ビッグデータはビッグなお金を生み出すデータ”という冗談のような定義さえあるぐらいです。データ活用についてもまだまだ誤解が多いのが現状で、言葉の定義から顧客としっかり意識合わせをし、必要な分析基盤を顧客と一緒に模索することが欠かせません」

そうした曖昧さが残る一方で、ビッグデータを巡る技術領域は日々進化している。「データを取り扱う基盤、そのデータを分析する理論やアルゴリズム、分析結果を適用する業務領域などが、関連しつつたえず進化を遂げています。そうした最新の知識を踏まえながら、私たちは顧客に最適なソリューションを提供しなければならないのです」

データサイエンティストに求められる素養を、チーム全体として実現

顧客企業のビッグデータ分析に関するニーズはさまざまだ。データをどのように利活用するかということだけでも、マーケティング、CRM、品質管理、IoTなどのニーズがある。

「また、ニーズのレベルにしても、ログが溜まっているのだが何か有効活用できないかというレベルから、スモールにスタートしたいのでクラウドに分析基盤を構築してほしい、あるいは、OLTPとOLAPを共存させたいといった高度な要求まで、本当にバリエーションが豊かです。

それに対して私たちは顧客ごとのビッグデータ活用ニーズに合わせて、Hadoop/Sparkはもちろんのこと、OSS、商用ソフトのいかんを問わず、あらゆる技術を駆使して、最適な分析基盤を提案することができます」

これがまさに、同社のビッグデータ基盤担当の基本的ミッションということになる。

同社のビッグデータ基盤担当は人員配置においても特徴がある。プロジェクトマネージャー(PM)を筆頭に、Hadoop/Spark/Storm/SQL/NoSQL/Java/Pythonなどに長けたシステムエンジニアがいる。

さらに自然言語処理/ディープラーニングなどの最新技術を身につけた機械学習エンジニア、データ解析のためにSPSS/SAS/Rなどのツールを駆使するデータアナリストやコンサルタントからなる精鋭部隊だ。

データサイエンティストという肩書きはそこにはないが、「一般にデータサイエンティストに求められる素養を、チーム全体として実現している」と、小山氏は言う。他社のビッグデータ組織に比べた時の優位性はどこにあるのだろうか。

「実務的な経験、とりわけ、Hadoopなどデータ蓄積基盤・データ分析基盤の開発経験の豊富さでは決して他社に負けていないと自負しています。また、私たちが気をつけている点としては、データ活用をしたことがない企業がまだまだ多いので、”納得感を持ってもらうこと”があります。

例えば、ディープラーニングの中身はブラックボックスですから、その予測結果や精度だけを詳しく説明してもただ“フーン”と言われるだけで、なかなか理解していただけない。ただ、そのような分析結果が出た理由を、入力データと紐付けつつ傾向を説明すると理解しやすい。

こうしたディープラーニングのブラックボックス問題は近年随所で指摘されていて、それに対して、説明可能な人工知能(XAI : Explainable Artificial Intelligence)という考え方も登場してきています。私たちも顧客に対して、結果の理由を提示する取り組みを強めています。それが必要なのも、顧客に公共系や金融系といった堅実な企業が多いから。ビッグデータ分析ひとつとっても、決してミスが許されない事業を営まれている企業が多いからです」

膨大なSNS分析から有益な顧客インサイトを得る

NTTデータ先端技術のビッグデータ・ソリューションの特徴をより深く理解してもらうために、いくつかの顧客事例を可能な範囲で紹介しよう。

Twitterの膨大なメッセージを分析して、自社製品オーナーの状況や関心を分析したある自動車メーカーの事例がある。例えばツイート内容からユーザーの属性(年齢、性別、居住地域等)を推定し、属性と興味項目を多面的に分析し、マーケティングに活用した。また、製品に対するネガティブツィートだけを抽出し、不満出現頻度を計算して、潜在するユーザーの願望を把握するという試みも行われた。製品の故障に関するツィートが多ければ、将来的にリコールが発生する可能性があるからだ。

「当社のアナリストが活用施策を提案し、実験的に導入していただきました。漠然とわかっていたことが数字で証明できたことで納得感ある説明ができたと思います。漠然とわかっているということは経験に基づくもの。属人的な経験を引き継ぐのは難しいので、こうしたシステムの有用性が証明された形になりました」と、小山氏は言う。

IoT分野での事例としては、車両走行データを元に、停めにくい駐車場や運転が荒い人が多い道路の存在などを抽出した試みもある。金融機関と組んだ例では、その金融機関にとっての顧客企業のWebページをクローリングして、ビッグデータ基盤に蓄積。それに対して機械学習を使って分析することで、審査・与信業務に資する情報取得に活用した例などもある。

他にも、Webコンテンツ配信サービスのマーケティング支援、パッケージベンダーにおけるフルOSS製品構成でのIoT分析基盤の構築、大規模なネットワークを運用している機関に向けた、拠点間のネットワークトラフィック監視をリアルタイムに実施できるシステムの構築などがある。

夢をリアルに。「予測」までの4ステップを顧客と共に歩む

こうした一例からもわかるように、同社のビッグデータ・ソリューションの幅は広く、多彩で、かついずれも先進的だ。ただどのようなデータ活用を目指すにしても、きちんとしたステップを踏んで、段階的に技術やソリューションを提供していく考え方が貫かれている。データ分析基盤もないままにいきなり予測結果を求める顧客に対して、論理的かつ説得力をもったビジネスが展開できているのだ。

そのステップとは、第一段階がBI(ビジネス・インテリジェンス)。伝統的なBIツールをはじめとして、対話的な分析機能が人気のTableauなどの実績が同社にはある。

「ここは、日次や毎時等、定期的に集計データを帳票の形で提供する段階で、伝統的なBIの技術分野と重なる分野です。非定型帳票を含む場合は、GUIでストレスなく操作できるよう、データウェアハウス(DWH)を用意する必要があります」(小山氏)

BIツールを使ったある程度のデータ分析に馴れている顧客には次の段階に進んでもらう。それがバッチ集計、アドホック集計などを中核にしたBA(ビジネス・アナリティクス)だ。

オンプレミス環境であればHadoopやSpark、クラウド環境であればAWS RedShiftやGCP BigQueryなどの活用実績がここで生きてくる。アドホック分析は、対話的に分析が進められるよう、レスポンスの良いDWHやTableau等のツールを組み合わせて対応する。

こうした段階を経ると、顧客の間にはデータをリアルタイムに分析したいという欲求が生まれてくる。これはストリーミング分析とも呼ばれる。ある時刻に起こったイベントに対して、リアルタイムに分析や集計を行い、その結果を通知するというもの。このステップでは、Spark Streamingでのリアルタイム処理や、Apache KafkaによるメッセージキューイングやNoSQLを組み合わせて分析していくことが多いという。

こうした段階を経てようやくたどり着くのが、第4のステップ「予測」だ。蓄積されたデータを元に、隠されたルールや未来など、人間の目に見えないものを予測するフェーズ。顧客はこうしてはじめてビッグデータの最大の果実を得ることができるようになる。ただ、この段階まで来ると高度なロジックの実装が必要で、機械学習ツールやライブラリを最大限活用することになるという。

「AIやビッグデータについて、一般社会はもとより、生死を分かつような喫緊のビジネス課題を背負う顧客企業にとっても、まだぼんやりとした夢を見ている段階にあります。しかし、それを一歩ずつでもリアルに進めなければ本当の意味でのビッグデータ活用はありえない。ITシステム基盤のために“尖った”我々だからこそ、そのお手伝いができると自負しています」

小山氏は、ビッグデータ分析基盤構築に賭ける自身のミッションをそう語るのだった。

おすすめのコラム

【レポート】データ分析を活用した経営コンサルティング体験ワークショップ

イベント

2018年9月2日(日)13時30分より、「エンジニア・アナリスト・マーケターが三位一体で行うビジネスデータ分析ワークシ...

【レポート】データ分析を活用した経営コンサルティング体験ワークショップ

経営コンサルティングファームBCGが手掛ける「機械学習による需要予測と最先端のデジタルイノベーション事例」

イベント

世界をリードするコンサルティングファーム、ボストン コンサルティング グループ(BCG)。近年、同社はデジタル化...

経営コンサルティングファームBCGが手掛ける「機械学習による需要予測と最先端のデジタルイノベーション事例」

【レポート】データサイエンスとインターネット・オブ・シングス - 第4回データアントレプレナーカンファレンス -

イベント

2018年7月13日(金)13時「第4回データアントレプレナーカンファレンス -データサイエンスとインターネット・オブ・...

【レポート】データサイエンスとインターネット・オブ・シングス - 第4回データアントレプレナーカンファレンス -