2011年5月25日水曜日

次世代クラウドコンピューティング(2)
                   -プロセス拡張型仮想マシン-

前回に続いて、近未来のクラウドについて探っていこう。
第1回はGPUサービスを紹介した。これは実際には高価で物理マシンには実装できない装備をクラウドならではの機能を利用して、ハード機能連携型仮想マシンとしてマッピングさせるものだ。第2回は、ビジネスインテリジェンス(BI)をクラウド提供するサービスについて考えてみよう。

◆ GoodDataのBI Platform as a Service
GoodDataというとAmazonとの関係を思い出す。
2009年夏のAWS Start-Up Challengeで見事大賞を射止めた会社だ。GoodDataはAWSのEC2/ESB/S3上でBIに必要なOLAP(Online Analytical Processing)やDWH(Data Warehouse)機能を提供する。

GoodDataの構造は4階層(上図、左から右へ)となっている。
勿論、1層目(左)は利用するクライアントシステムだ。ここからRESTインターフェースの Cloud API(2層目)でGoodDataと結合する。APIにはGoodDataのプロビジョニングやプロジェクト管理、アカウント等のインフラ、データーコネクション、アナリシスがある。実際のエンジン(3層目)では前処理のETL(抽出-Extract、変換-Translation、保存-Load)、そして、分析やレポーティングが非同期キューによって並行実行される。
つまり前回紹介したAWSで複数インスタンスを扱えるHPC on EC2を利用している。これら連携の全てはRESTインターフェースで指示されたものだ。このような組み上げとは別にバックエンドとして用意されたアプリケーションもある。利用ユーザー企業の多いSalesforce向けにはAppExchangeに登録されたシステムがあり、これを使えばCRMとBIが簡単に連動可能である。またユーザーと担当窓口とのやり取りをフィードバックソリューションとして手がけるMarketMetrixなども用意されている。

◆ 1010dataのDWHクラウドサービ ス
1010dataのDWHクラウドはさらに特化したサービスである。
対応するデータベースは列指向(Column-Oriented DBMS)で、同社が開発したTenbaseを利用する。この列指向のDBとWebベースのBIエンジンの採用により、ユーザーは導入が容易で、より高速化されたBIシステムを手に入れることができる。米国経済はサブプライムローンで大問題を引き起こしたが、1010dataのDWHクラウドは、優良な米不動産担保証券業界で利用が進み、大量データ処理を必要とする支払い履歴やデフォルトリスク分析で活躍、健全な市場形成に役立っている。この流れを反映して、最近では小売業やヘルスケアにも広がりだした。


LogiXMLのXML BIエンジン
LogiXMLの場合はXMLベースのクラウドエンジンが特徴だ。
核となる製品はLogi Info。Logi Infoは同社が用意した各種エレメントを組み合わせて利用するユニーク・エレメンタル・アプローチが採用されている。これによって、ユーザーは自社独自のBIシステムをクラウド上で容易に構築が出来る。レポーティングもまた、クラウド上のLogi Reportを利用し、より効果的なチャート作成が可能だ。ユーザーから見れば、BIシステムを開発するというより、必要なエレメントに情報を与えて、組み合わせれば出来上がりという感じである。システム全体は、クラウド上にあるExcelデータベースとレポーティング/チャート作成ツールだと思えば良い。もちろん、データ抽出にはLogi ETLがあるし、モバイルで利用するLogi Mobileも用意されている。

◆ オープンソース勢の進撃 - Pentaho、JasperSoft
BI分野でのオープンソースの頑張りは見逃せない。
まず、オープンソースを全面に打ち出して市場の評価を受け、そしてクラウドへ突き進むのはPentahoだ。同社はこれまで多くのオープンソース・プロジェクトを統合してきた。デベロッパー重視のコミュニティーを尊重し、その作業結果をコマーシャル製品に反映させる。これがポリシーだ。同社製品には、BIに必要なETL、OLAP、クエリー、レポーティング、分析、データーマイニングなどがあり、それらを統合したBI Suiteがもっとも人気が高い。これらの実績のもとに、2009年3月、BI Suite 3.0をベースとしたPentaho BI Suite Cloud Computing Editionを発表した。これを使えばAmazon EC2上で簡単にBIシステムが構築出来る。同年10月にはWebベースのインタラクティブ・レポーティング・ツールLucidEraも買収。より簡単で、高度なレポーティングも可能となった。

オープンソースBIのもう一方の雄はJasperSoftだ。
同社の強みはレポーティングツールJasperReportと、そのライブラリーである。このツールは瞬く間に世界中に広がり、その後、OLAPを開発、全体がJaspersoft BI Suiteとして整備された。そして、今年3月、同じオープンソースのBitNamiと提携してクラウドに進出した。オープンソースは便利だがインストレーションが難しいと思う人は多 い。特に複数の製品を扱えば、それらの相性を合わせる設定には苦労がいる。BitNamiはこの課題をアプライアンス技術で解決してくれる。Webサーバーやデータベース、言語ランタイムなどをスタック化してライブラリーとして整備し、専用のインストラーでローカルマシンにインストールし たり、仮想マシンイメージなら、クラウド上で実行させることが可能だからだ。こうしてJasperRoport Community EditionがAWSなどのクラウド上に登場した。


◆ 無限に広がる可能性-プロセス拡張型の仮想マシン
BIと言えば、過去は大手ベンダーの独壇場だった。
データベースやデータマート、OLAPなど複雑で高度な分析処理が必要だからだ。
しかし、2007年になって、市場は大きく動いた。同年3月-OracleがHyperionを買収、同10月-SAPがBusiness Objects、そして同11月-IBMがCognosを買収した。
この辺りの事情は<消えるかBI業界> として、以前に書いたものがあるので参照されたい。

その後、クラウドが登場して、状況は再度、変わり始めた。
まず、BI処理の最終段階で必要なレポーティング機能がクラウド化し、次いで、大容量のクラウドストレージが処理できる本格的なデータベースも動き出した。今ではBIでは欠かせない並行計算の分析処理も可能となった。これを通常のSaaSだと単純に片付けるわけにはいかない。利用するユーザー企業からみれば、BIは定型業務ではなく、どの企業も異なる戦略的な分析業務である。その柔軟性を可能にするには、基本の流れだけでなく、自在な拡張機能が必要だ。そのために用意された特別なデーターベースや実行エンジン、さらにはAPIなど、これらを駆使すれば、自社専用のBIシステムを作り上げることが出来る。今日のBIクラウドは、進化したSaaSである。自律型SaaSと言っても良い。ポイントとなる拡張機能は、専用プロセスとして提供される。今後、ユーザーはクラウドならではの連携を活かして、異なるクラウドから幾つかの専用プロセスを組み合わせて作り上げることも可能となるだろう。そして、大事なことは、このプロセス自身も、与えられたパラメータで柔軟に動く構造でなければいけないことだ。

このような傾向はBI分野だけでなく、エンジニアリングや医療、環境などの分野でも見え始めている。もう、機能拡張型の自律した仮想マシンを駆使することも夢ではない。