2011年5月25日水曜日

次世代クラウドコンピューティング(2)
                   -プロセス拡張型仮想マシン-

前回に続いて、近未来のクラウドについて探っていこう。
第1回はGPUサービスを紹介した。これは実際には高価で物理マシンには実装できない装備をクラウドならではの機能を利用して、ハード機能連携型仮想マシンとしてマッピングさせるものだ。第2回は、ビジネスインテリジェンス(BI)をクラウド提供するサービスについて考えてみよう。

◆ GoodDataのBI Platform as a Service
GoodDataというとAmazonとの関係を思い出す。
2009年夏のAWS Start-Up Challengeで見事大賞を射止めた会社だ。GoodDataはAWSのEC2/ESB/S3上でBIに必要なOLAP(Online Analytical Processing)やDWH(Data Warehouse)機能を提供する。

GoodDataの構造は4階層(上図、左から右へ)となっている。
勿論、1層目(左)は利用するクライアントシステムだ。ここからRESTインターフェースの Cloud API(2層目)でGoodDataと結合する。APIにはGoodDataのプロビジョニングやプロジェクト管理、アカウント等のインフラ、データーコネクション、アナリシスがある。実際のエンジン(3層目)では前処理のETL(抽出-Extract、変換-Translation、保存-Load)、そして、分析やレポーティングが非同期キューによって並行実行される。
つまり前回紹介したAWSで複数インスタンスを扱えるHPC on EC2を利用している。これら連携の全てはRESTインターフェースで指示されたものだ。このような組み上げとは別にバックエンドとして用意されたアプリケーションもある。利用ユーザー企業の多いSalesforce向けにはAppExchangeに登録されたシステムがあり、これを使えばCRMとBIが簡単に連動可能である。またユーザーと担当窓口とのやり取りをフィードバックソリューションとして手がけるMarketMetrixなども用意されている。

◆ 1010dataのDWHクラウドサービ ス
1010dataのDWHクラウドはさらに特化したサービスである。
対応するデータベースは列指向(Column-Oriented DBMS)で、同社が開発したTenbaseを利用する。この列指向のDBとWebベースのBIエンジンの採用により、ユーザーは導入が容易で、より高速化されたBIシステムを手に入れることができる。米国経済はサブプライムローンで大問題を引き起こしたが、1010dataのDWHクラウドは、優良な米不動産担保証券業界で利用が進み、大量データ処理を必要とする支払い履歴やデフォルトリスク分析で活躍、健全な市場形成に役立っている。この流れを反映して、最近では小売業やヘルスケアにも広がりだした。


LogiXMLのXML BIエンジン
LogiXMLの場合はXMLベースのクラウドエンジンが特徴だ。
核となる製品はLogi Info。Logi Infoは同社が用意した各種エレメントを組み合わせて利用するユニーク・エレメンタル・アプローチが採用されている。これによって、ユーザーは自社独自のBIシステムをクラウド上で容易に構築が出来る。レポーティングもまた、クラウド上のLogi Reportを利用し、より効果的なチャート作成が可能だ。ユーザーから見れば、BIシステムを開発するというより、必要なエレメントに情報を与えて、組み合わせれば出来上がりという感じである。システム全体は、クラウド上にあるExcelデータベースとレポーティング/チャート作成ツールだと思えば良い。もちろん、データ抽出にはLogi ETLがあるし、モバイルで利用するLogi Mobileも用意されている。

◆ オープンソース勢の進撃 - Pentaho、JasperSoft
BI分野でのオープンソースの頑張りは見逃せない。
まず、オープンソースを全面に打ち出して市場の評価を受け、そしてクラウドへ突き進むのはPentahoだ。同社はこれまで多くのオープンソース・プロジェクトを統合してきた。デベロッパー重視のコミュニティーを尊重し、その作業結果をコマーシャル製品に反映させる。これがポリシーだ。同社製品には、BIに必要なETL、OLAP、クエリー、レポーティング、分析、データーマイニングなどがあり、それらを統合したBI Suiteがもっとも人気が高い。これらの実績のもとに、2009年3月、BI Suite 3.0をベースとしたPentaho BI Suite Cloud Computing Editionを発表した。これを使えばAmazon EC2上で簡単にBIシステムが構築出来る。同年10月にはWebベースのインタラクティブ・レポーティング・ツールLucidEraも買収。より簡単で、高度なレポーティングも可能となった。

オープンソースBIのもう一方の雄はJasperSoftだ。
同社の強みはレポーティングツールJasperReportと、そのライブラリーである。このツールは瞬く間に世界中に広がり、その後、OLAPを開発、全体がJaspersoft BI Suiteとして整備された。そして、今年3月、同じオープンソースのBitNamiと提携してクラウドに進出した。オープンソースは便利だがインストレーションが難しいと思う人は多 い。特に複数の製品を扱えば、それらの相性を合わせる設定には苦労がいる。BitNamiはこの課題をアプライアンス技術で解決してくれる。Webサーバーやデータベース、言語ランタイムなどをスタック化してライブラリーとして整備し、専用のインストラーでローカルマシンにインストールし たり、仮想マシンイメージなら、クラウド上で実行させることが可能だからだ。こうしてJasperRoport Community EditionがAWSなどのクラウド上に登場した。


◆ 無限に広がる可能性-プロセス拡張型の仮想マシン
BIと言えば、過去は大手ベンダーの独壇場だった。
データベースやデータマート、OLAPなど複雑で高度な分析処理が必要だからだ。
しかし、2007年になって、市場は大きく動いた。同年3月-OracleがHyperionを買収、同10月-SAPがBusiness Objects、そして同11月-IBMがCognosを買収した。
この辺りの事情は<消えるかBI業界> として、以前に書いたものがあるので参照されたい。

その後、クラウドが登場して、状況は再度、変わり始めた。
まず、BI処理の最終段階で必要なレポーティング機能がクラウド化し、次いで、大容量のクラウドストレージが処理できる本格的なデータベースも動き出した。今ではBIでは欠かせない並行計算の分析処理も可能となった。これを通常のSaaSだと単純に片付けるわけにはいかない。利用するユーザー企業からみれば、BIは定型業務ではなく、どの企業も異なる戦略的な分析業務である。その柔軟性を可能にするには、基本の流れだけでなく、自在な拡張機能が必要だ。そのために用意された特別なデーターベースや実行エンジン、さらにはAPIなど、これらを駆使すれば、自社専用のBIシステムを作り上げることが出来る。今日のBIクラウドは、進化したSaaSである。自律型SaaSと言っても良い。ポイントとなる拡張機能は、専用プロセスとして提供される。今後、ユーザーはクラウドならではの連携を活かして、異なるクラウドから幾つかの専用プロセスを組み合わせて作り上げることも可能となるだろう。そして、大事なことは、このプロセス自身も、与えられたパラメータで柔軟に動く構造でなければいけないことだ。

このような傾向はBI分野だけでなく、エンジニアリングや医療、環境などの分野でも見え始めている。もう、機能拡張型の自律した仮想マシンを駆使することも夢ではない。

2011年5月9日月曜日

次世代クラウドコンピューティング(1)  
                 -ハード機能連携型仮想マシン-

クラウドは単なる仮想マシンでは終わらない。
この仮想マシンを機能強化することが出来れば、その先に未来のコンピューティングがある。今回からシリーズで、それを予感させる幾つかの動きを追ってみよう。
第1回は「GPUサービス」について検証しよう。

◆ インターネット+クラウド+新たな利用=フューチャーシステム
このブログでは、クラウドは第2のインターネットだと度々述べてきた。
インターネットが公共性という視点で成功してきたようにクラウドもその延長線上にある。このことが理解されれば、成長に疑いはない。そして、その先に将来の姿が見えてくる。代表的なクラウド用語にIaaS/PaaS/SaaSの領域区分がある。これを便宜上、将来のコンピューティングにあてはめると、現在のインターネットはコミュニケーションのインフラ(IaaS)、クラウドはコンピューティングのためのプラットフォーム(PaaS)となり、そしてSaaSにあたる部分こそが重要で、ここが次世代クラウドを占う鍵となる。


◆ GPUサービスとは何か(NVIDIA Tesla)
北米では既にGPU(Graphic processing Unit)サービスが始まった。
これが将来のSaaS部分の構成要素を予兆させる動きのひとつだ。高性能GPUベンダーには2社(NVIDA、AMD/ATI)があるが、これらを用いたプロバイダーの提供アプローチは異なる。まずNVIDIAのGPUを使ったサービスでは、通常の仮想マシンでは処理出来ない高性能グラフィック処理をクラウドに任せようとする傾向にある
このサービスを最初に手がけたのは、サーバーやストレージのクラスターリングに強みを持つPenguin Computerで、そのサービスはPoD(Penguin on Demand)という。PoDはHPCをリモートからオンデマンドでユーザーに提供するもので、その目玉サービスがGPUサービスだ。PoDでは、ユー ザーはHPCにスケジューラーを介してジョブを投入する。GPUサービスは、このHPCに付帯する専用サーバーであり、実際のところ、4 Core Xeonを2つとNVIDIA Tesla C1060を搭載したLinux機である。ユーザープログラムからはOpenCLCUDAなどでアクセスし、このグラフィク処理専用システムを時間借りする。このような提供タイプを“Hosted Reality Server”と言い、ユーザーはGPUを物理サーバーとして認識することが出来る。PoD同様、HPCとGPUサーバーを組み合わせて提供するカナダのPeer 1で は、このクラウドサービスをHPCC(High Performance Cloud Computing)として、金融機関や自動車設計、科学計算などに提供している。また、テキサス州ヒューストンのNimbixからもGPUサービスを全面に押し出したNACC (Nimbix Accelerated Cloud Computing)が始まった。

HPC on Amazon EC2
Amazonからも昨年7月、 EC2上でのHPCサービスHPC on EC2がスタートした。
この新方式では、他のインスタンスより多くのCPUで構成されるHPC向けインスタンス“Cluster Compute Instances for Amazon EC2”が定義された。正確には、1つのインスタンスでEC2 Compute Unitが33.5台、RAMは23GB、Instance Storageは1690GB、そして10GBのI/Oを持ち、最大8つまで拡張が可能だ。これを使えば、小型から中規模程度のHPCとして利用すること が出来る。このCluster Instanceのひとつに“Cluster GPU Instance”がある。これがGPUサービスだ。このインスタンスは通常のCluster Instanceに2つのNVIDIA Tesla M2050が搭載されたものだと思えばいい。このような専用サーバーではなく、あくまでもインスタンスとして提供するGPUサービスのタイプを“Hosted GPU”という。

◆ AMDとOTOYの目指すGaaS(Game as a Service)
次にAMDの対応を見る前に、 GPU市場を一瞥しよう。
AMDは2006年7月、カナダのATIを買収してこの市場に参入した。数字だけをみれば、これまでIntelがGPU マーケットの約半分、残りをNVIDAが優勢のうちにAMDとシェアしてきた。Intel製はローエンドのPC用、NVIDIAはPCのハイエンド、 AMDはさらに上の上位PCからワークステーションをカバーするという構図だ。しかし、昨年夏あたりから状況が変わり始めた。AMDが数字的にNVIDIAに対してややリードし始め、今年に入ってもその状況が続いている。ポイントは3Dゲームなどの普及で、より高性能なGPUが優位になったことだ。中でも、今年3月始めに出たデュアルGPUのAMD Radeon HD 6990がけん引役となっている。

さて、話を戻そう。
OTOYという会社が2008年、AMDからスピンアウトした。
OTOYを率いるのはJules Urbach氏だ。氏はAMD時代にサーバーサイド・グラフィックスの開発を担当していた。この技術を使えば、PCに高価なGPUを搭載することなく、サーバー側で高速レンダリング処理を行い、それをクライアントに転送して、ブラウザだけで表示することができる。つまり、HTMLだけで、精密なレンダリングが出来、しかも動画として見せることも可能となる。これが出来ればHPCがクラウドにあって、超精密レンダリングを担当し、一般のPCだけでなく、モ バイルなどでも3Dゲームが楽しめる時代がくる。まさにGaaS(Game as a Service)の到来だ。

   
もちろん、このサーバー側にはAMD/ATIの高性能GPUが使われており、AMDはこれを“AMD Fusion Render Cloud”としてCES 2009で発表した。現在、OTOYのホームページには、幾つかのサンプルがあるが、これが実用化されるのが待ち遠しい。
ま た、同社では同様の技術範疇のLightStage技術も完成させている。これはモーションキャプチャーとして、人の微細な表情までも再現できるフェイシャルレンダリングで、映画「アバター」や「スパーダーマン」、日本では「ガイキング」などに使われた技術だ。

◆ 無限に広がる可能性-ハード機能連携型の仮想マシン
今回は将来のクラウドを占うひとつの好例として、GPUクラウドを取り上げた。
これまで価格面から、一般のサーバーには高性能GPUは搭載されず、グラフィックス系
アプリケーションの処理は出来なかった。しかし、クラウドによるGPUサービスの登場で徐々に解禁されつつある。ここでポイントとなるのは、クラウドによって物理マシンから開放され、仮想マシンに処理が移り、さらにそれが別な高性能GPUを搭載した仮想マシンとマッピングされることである。この連携型の仮想マシンを使えば、HPCやGPUを必須とする車や列車、飛行機などの訓練シミュレーションが廉価なシステムとして可能となる。類似の事例には、CAD大手Autodeskが始めたプラスティック製品のモルディング加工シミュレーションがある。これは同社のMoldflowをクラウドで稼動させるプロジェクトだ。AutoCADからもiPhoneやiPadでCAD図面にアクセスするAutoCAD WSが始まった。もう、こうなれば、手元のスマートフォンから、クラウド上で連携する最強のマシンを操ることも可能となるであろう。