2009年11月15日日曜日

グリッドとクラウドの融合
-Nimbus & OpenNebula-

前回、米エネルギー省(DOE-Department of Energy)傘下の国立研究所で始まったHPCベースのCloud Computingに関する実証実験-Magellan Project-の開始を紹介した。ただ、HPCというと、現OGF(Open Grid Forum)-旧GGF (Global Grid Forum)-などのGrid Computingを思い浮かべ、そして、Grid Computingはアカデミックの人たちのもので、古く、現在のCloud Computingとは異質のものだと漠然と考える人たちが多い。この誤解については、Globusが2007年にリリースしたWorkspace ServiceのAmazon EC2 Gatewayによって解かれたところまでを説明した。つまり、Grid ComputingとCloud Computingは補完関係にあり、EC2のComputing NodeをGrid Computingで束ねて、より大きな作業領域を作り出すことが出来る。そこで今回は、引き続き関連するテーマとして、米国と欧州の2つのオープンソー スプロジェクトを報告しよう。

◆ Nimbus

Globusの始めたWorkspace Serviceは、GGFのWSRF(Web Service Resource Framework)を基本的なベースにして、Grid Computingの流れを汲みながら、徐々にCloud Computingへと進化した。この新たな試みをNimbusプロジェクトという。Nimbusは、Globus toolkit同様、シカゴ大学(University of Chicago)とアルゴンヌ研究所(Argonne National Laboratory)が中心となって開発したオープンソースのソフトウェアセットで、HPCはもとより、クラスタリングサーバーなどのIaaS構築をサポートする。ライセンスはApache License 2。

Nimbusの提供するサービスは下図で示されるように「Compute」と「Storage」の2つ。ComputeがWorkspace Serviceであり、StorageはFTP Serviceである。

Nimbus の仮想化技術はXen(最新版TP2.2)だが、近々、KVM(Kernel-based Virtual machine)も予定されている。グリッドをクラウドに重ね合わせ、利用者により大きな空間を提供する「Workspace Service」では、Xenによって出来上がった仮想マシン(VM-Virtual Machine)をクライアントからの要求(Client Initiation)に従ったサイズにすべく、VMM(Virtual Machine Monitor)-仮想化ソフトウェア-と連携し、結果をクライアントに返す。この際のリソース管理は2つ。デフォルトはプールされた仮想マシンを直接利 用する「Resource Pool」、もうひとつはNASAが開発した分散環境下のジョブスケジューリングが出来るワークロード管理OpenPBSな どのLRMS(Local Resource Management System)を用いる方式である。Nimbusでは、また、次に紹介するOpenNebulaをWorkspace Serviceのバックエンドとして連携させる試みも行われ、将来は本格的な連携も期待されている。

Nimbusのクライアントからの使い方を見てみよう。
標 準となるのは「Cloud Client」で、構築したNimbusシステム上でWSRFと連携したWorkspace Serviceを受け「EC2 Client」はWSDL(Web Service Definition Language)でNimbusと連動し、EC2リソースを利用したWorkspace Serviceを受ける。また「Context Client」とは、Workspace Serviceベースではなく、仮想の大型クラスターをContext Broker経由でNimbus上で利用する形態をいう。

◆ OpenNebula

NimbusがGlobus/OGFを核とした米国中心の活動であるのに対し、OpenNebulaプロジェクトは、ヨーロッパがベースだ。2002年から始まったスペイン最大マドリード・コンプルテンセ大学(Universidad Complutense de Madrid)のDistributed Systems Architecture Research Groupが 開発したものだ。ユーザーはこのツールを適用して、HPCや企業内データセンターのクラスターシステムなどを仮想インフラ化してクラウド利用する。 OpenNebulaはIaaS構築のVirtual Infrastructure Managerとして機能し、仮想マシンだけでなく、ストレージやネットワークの管理も実行する。最新版のOpenNebula 1.4では、仮想化はXenだけでなく、KVM、VMwareにも対応し、Virtual Boxも1.4.2で計画されている。また、利用リソースは、Nimbus同様、自前のローカルリソースだけでなく、Amazon EC2、英ElasticHostsをハイブリッドクラウドとして利用することができる。ライセンスもNimbus同様、Apache License 2。














-特徴-
  • Dynamic Resizing/Dynamic Cluster Partitioning-新らたに物理ホストを追加すると瞬時に自動システムサイズ拡張を実行、またパーティショニングによるクラスターサイズも動的変更ができる。
  • Centralized Management全ての仮想・物理マシンを中央管理し、カスタマイズのためにユーザーやシステム管理者にAPIを提供。
  • Higher Utilization of Existing Resources-異なる組織で管理するサーバーや異機種などの現存するリソースを組み入れることができる。
  • Lower Infrastructure Expenses-自前リソースと外部クラウドをハイブリッド利用し、実質コストを抑制する。
さて、このOpenNebulaには、幾つかヨーロッパとしての大事な役割がある。
まず、欧州連合(EU-European Union)がファンディングしているResevior(後述)、次がスペイン工業・観光・通商省が後援し、スペイン最大の電話会社Telefonica が民間8社のコーディネーターとなって進めるNUBA(Normalized Usage of Business-oriented Architecture)プロジェクト、来年からはスペイン科学・革新省のスポンサーによるHPCを本格的に利用したクラウドHPCcloudプロジェ クトなどだ。OpenNebulaはこれらプロジェクトの基盤ソフトウェアとして利用され、一方で、その成果を民間にオープンソースとして提供する役割を 担っている。

◆ Reservoir


Reservoirは EUがスポンサーのプロジェクトで、第7次研究・技術開発のための枠組み計画(FP7)に沿い、ソフトウエアや通信分野の大手企業が中心となって、 2005年に発足したオープンスタンダードにもとづくソフトウエアとサービス開発を目指すNESSI(Networked European Software and Services Initiative)と連携するものである。プロジェクトの課題は、異なるITシステムやサービスのバリアを無くし、真にユーザーフレンドリーな環境の 提供を目指すもの。このためにCloud Computingを用いて異なるITプラットフォームやITサービスを境目無く提供する管理技術を研究する。プロジェクトの実際の活動は、イスラエルに あるIBMのHaifa Research Labが核となり、パートナーとして独SAP Research、米Sun Microsystems、スペインTelefonica Investigacion y Desarrollo、仏Thales、スウェーデンUmea University、英University College of Londonなどが参加。また、NESSIには、仏Atos Origin、英BT Group、伊Engineering Ingegneria Informatica、IBM、HP、フィンランドNokia、独SAP、独Siemens、独Software AG、伊Telecom Italia、スペインTelefoica、仏Thales、現OW2(旧ObjectWebコンソーシアム)などが参加。

◆ LHC Computing Grid

世界最大のGrid Computing、それは昨年7月に運用が開始されたWorldwide LHC Computing Gridである。CERNとして知られる欧州原子核機構がジュネーブ西方の
レマン湖畔にフランスをまたぐ全周 27km の円形加速器LHC(Large Hadron Collider)を設置し、2008年から実験が開始された。LHC Computing Gridは、この加速器を用いた実験分析用として作られたものである。
世界34ヶ国、170のコンピューティングセンターの100,000 CPUをグリッド結合して、各 国の研究所や大学から直接利用することが出来る。この巨大な分散ネットワークは、3つのTierと呼ばれるレイヤーからなり、Tier 0はCERN自身のComputing Centerで、全てのジョブのLHCデータはこのハブを通して供給され、主要な他のレイヤーとは10GBで接続されている。次のTier 1は、LHCデータ保存のため、比較的大きなストレージ容量を持った11のコンピュータセンターが選ばれ、LHCデータは、このTier 1からさらに160のTier 2となるデータセンターに送られて使用される。ミドルウェアとして利用されているのは、Grid Computing構築のGlobus Toolkit、ウィスコンシン大学で開発した分散スケジューリングのCondorとグリッドソフトウェアの統制図るVirtual Data Toolkit、欧州のEnabling Grids for E-sciencE(EGEE)が開発した軽量のグリッドツールgLite Toolkitなどだ。Worldwide LHC Computing Gridの試運転は昨年7月、本格的な運用は10月からだった。そして1年、これまでの稼動実績は18,500万ジョブにのぼる。今後はグリッドとクラウドの融合技術が検討予定だと聞く。


本稿では、米欧、2つのHPC用クラウド構築プロジェクトを紹介した。
こ れらを詳しく調べると、現在の商用Cloud Computingの将来展望が見え始める。サーバーはラックマウントなどの単なるコモディティーから、ブレードサーバーより高度なHPCへ、さらにはデ スクトップからサーバーへと進化した仮想化技術も無数のノードが前提となる。この分野が実用化されれば、より効率的で巨大なクラウドが出現する。

2009年11月8日日曜日

HPCを使ったクラウドコンピューティング
-DOEのマジェラン・プロジェクト(Magellan)-

米エネルギー省DOE(Department of Energy)傘下の国立研究所には大型のHPC (High Performance Computing)が多数設置されている。
そこで、これらのHPCを利用したCloud Computingの実証実験がスタートすることになった。マジェランプロジェクト(Magellan Project)という。資金はObama政権下で
2月に成立した米経済再生法American Recovery and Reinvestment Act (ARRA)から$32Mが使われる。中心となるのは国立アルゴンヌ研究所(Argonne National Laboratory)のArgonne Leadership Computing Facility (ALCF)とローレンス・バークレイー研究所(Lawrence Berkeley National Laboratory)のNational Energy Research Scientific Computing Center (NERSC) だ。ALCFには複数台のタイプの異なるIBM Blue Geneがあり、NERSCにはCrayのFranklinやSGIのDaVinc(Altix 350)などが設置されている。

プ ロジェクトの目的は、科学アプリケーションがどのようなCloud Architectureに向くのかを調べ、その上でHPCをどうすればクラウド化することが出来るかを見極めること。これはまた、HPCアプリケーショ ンをどうやってCloud Computingに最適化するかでもある。一般のPublic Cloudで科学アプリケーションを動かすにはネットワークパフォーマンスの問題、さらにメモリーや計算処理能力そのものも不足しており、もっとハイパ ワーでなければならない。HPCは計算能力は高いが、仮想化などの実績に乏しい。

Public Cloudに限らず、通常のCloud Computingでは、仮想化ソフトウェアを用いて無数の仮想化マシンを作り出し、それらにOSを含めたソフトウェアが搭載される。一方、HPCでは無数のノードを論理的に束ねて、大きな仕事を実行する。その意味で、HPCを用いたCloud ArchitectureはGrid Computingに近い。大きなものを分割して利用する今日的なCloud Computingと、
小さなものを集めて大きな仕事をするGrid Computing。この2つは共に異なる仮想化の世界作り出し、補完関係にあると考えられるが、技術的にはまだ隔たりも大きい。

◆ GridとCloudの融合

こ こで少しGrid Computingの歴史を振り返ってみよう。旧GGF-Global Grid Forum(現OGF-OpenGrid Forum)がGrid ArchitectureにWeb Service/SOA技術を適用したOGSA(Open Grid Service Architecture)を定め、全体のリソース管理を司るWeb Service Resource Framework (WSRF)を発表したのは2004年のこと。Xenがリリースされたのは2003年、Amazon EC2が2006年であるから、WSRFはその中間の時期に登場した。そしてGGFと関係が深く、オープンソースグリッド作成ツールで有名なGlobusがこのWSRFをもとにWorkspace Serviceを2005年にリリース。
このサービスは、分散処理を前提にしながら、より快適な大型作業空間を提供する。

つ まり科学アプリケーションなど向けに、より大型のコンピューティング環境をGrid Computing技術で可能としたものだ。2007年には、Amazon EC2向けのGatewayも用意され、EC2の仮想マシンを無数に利用したWorkspace Serviceが可能となった。これによって、Grid ComputingとCloud Computingは、技術的に補完関係であることが証明されたわけである。

◆ 国立研究所を繋ぐ100 Gpsネットワーク

Magellan Projectに先立ち、同じARRA資金-$62M-を使った100 Gigabit Ethernet Projectも動き出した。このプロジェクトは、ローレンス・バークレイー研究所が中心となって今年8月にスタートし、DOE傘下の複数の国立研究所 (Sandia、Lawrence Livermore、Lawrence Berkeley、Oak Ridge、Los Alamos、Brookhaven、Argonne、Pacific Northwest)とシリコンバレーにあるNASA Ames Research Centerが結ばれる。この高速ネットワーク網とHPC内のInterconnect-ブレード接続ネットワーク(Back Panel)-を最適化することでネットワークパフォーマンスは大幅に改善される筈だ。

◆ 並列処理ソフトウェア

Grid Computingにとって並列処理は欠かせない。
Goolge が稼動させる巨大な検索エンジンプラットフォームこそ、まさに並列処理の塊である。ここで使われているGFS(Google File System)は、高信頼分散ディスクシステムであり、MapReduceは並列処理そのものだ。これらのオープンソースクローンとしてYahoo Labが開発したHadoopはその後、Apache Software Foundationに寄贈されてプロジェクトとなり、さらにプロジェクトメンバーによる商用サポートのClouderaも 設立された。Hadoopでは、GFSがHadoop Distribution File Systemとなり、その上にHadoop MapReduceとGoogleのデータベースBigTableに相当するhBaseがある。さらに大規模データセットの並列処理言語として、これも Yahoo Labが開発したPigHiveも用意されている。この分野には他に、2007年9月、Sunが買収した大規模分散ファイルシステムのオープンソースLustre既報)、 Oracle RAC(Real Application Cluster)などもある。RACは、複数のアプリケーションサーバーから分散データベースをアクセス可能とするクラスター型ディスク共用技術 Common Disk Clusteringとサーバー間を高速で同期化させるChache Fusionからなる技術だ。
◆ HPCに熱中するITベンダー

もうひとつ大事なことがある。ITベンダーの動きだ。
IBM やSunなどのITベンダーは、Grid Computingがいずれ科学計算分野から抜け出て、商用に展開できることを期待している。なかでもIBMは強力にGGF を支援して来たし、Sunは初のグリッド商用プラットフォーム構築ツールN1 Gidを開発、今日、その技術はHPC適用のSun Grid Engineとして提供されている。

DOEに導入されている沢山のHPCがクラウド化されれば、商用への道程は近い。
マジェランプロジェクトの作業は、科学アプリケーションワークロードのクラウド適用だが、ここまでくれば、次はHPCに適したクラウドインフラや並列処理の各種ソフトウェアが搭載されて、企業データセンターへ適用するという別な世界が開ける。

2009年10月24日土曜日

OpSourceがCloud Computer事業に参入
-SaaaSの経験をIaaSにも-

「SaaSプラットフォーム・サービスプロバイダーOpSourceがCloud Computing市場に参入した」と聞いてもピンとこないかも知れないが、これまで同社がSaaSビジネスで経験した実績をもとにIaaS(Infrastructure as a Service)も開始したと言ったらはっきりするだろう。

◆ SaaSプラットフォームの提供(OpSource On-Demand)

まず始めに、OpSourceのこれまでの基本ビジネスについて説明しよう。
米 国では、独立系のソフトウェアベンダーISV(Independent Software Vendor)などを中心に、これまでの販売形態からの脱皮を目指してSaaS化が進んでいた。しかし、自前でSaaSシステムを構築することは、時間的 にも資金的にも容易ではない。これまでのOpSourceのビジネスはこれらの潜在顧客にSaaSプラットフォームを提供することだった。つまり、彼らが 必要とするプラットフォームソフトウェアやデータセンターなどの一式を提供、結果、ユーザーは自分のアプリケーションのみに集中することができた。これがOpSource On-Demandである。


こ のサービスを用いると、委託されたアプリケーション群は、OpSource Service Bus (OSB)上で稼動し、同一委託ベンダー分に限って、アプリケーション間の連動が可能となる。さらにこれらのアプリケーションは、OSBを介して、 OpSourceが用意した各種ツールとも連携が取れる。これらを利用すれば委託ベンダーは、特別なツールを使う
ことなく、詳細情報を手に入れることが可能だ。下図の分析(Analytics)ツールでは、日別や期間別のトランザクション量、同様に日別/業務別のレスポンスタイムの把握
などができる。


◆ ビリング・ライフサイクル管理(OpSource Billing CLM)

同様に用意されたビリング機能は、特に優れものだ。
使 用コンピューティング・リソースや各種サービスをもとにした請求処理は、どのCloud Computingでもあるが、委託アプリケーションを利用するエンドユーザー向けビリング機能はなく、その内容には感心する。このエンドユーザー向け OpSource Billing Customer Lifecycle Management(CLM)を使うことで、エンドユーザーの利用情報の収集、請求書の発行、支払いなどが一連の処理として実行できる。例えば、ISV が自社開発のパッケージソフトウェアをSaaSとして提供する場合、エンドユーザーは自分のアカウントを作り、ログオンして利用し、オンボードで自分のビ リング情報を常時閲覧しながら利用分の請求を受ける。これらの一連の処理は、CLMに用意されたAPIを用いて、アプリケーションと統合することで可能と なる。委託ベンダーはまた、ユーザー課金を自社戦略に従い、サブスクリプションなのか、使用量払い(Pay by USE)なのかを決めて組み込むことも出来る。支払いは、クレジットカード、デビッドカード、小切手にも対応し、PayPalなど他のマイクロペイメン ト・システムと比べて大幅な機能向上が図られている。

◆ 委託企業ブランドによるカスタマーケア

OpSource On-Demandで、もうひとつ重要なのは、カスタマーケア(Customer Care)だ。SaaSビジネスはコンピュータだけでは処理が出来ない。そのため委託企業名で、エンドユーザー向けコールセンターを24時間対応で提供し ている。委託企業とのチームワークによって、トレーニングされた要員が全てをサポートする。この仕組みによって委託企業は、ITインフラだけでなく、コー ルセンターの人的資源も削減することが出来る。

◆ 新しいIaaSサービス(OpSource Cloud)

今回、発表された新IaaSサービスのOpSource Cloudは、SaaSプラットフォーム
ビ ジネスの経験の延長にある。SaaSは当然、何らかのインフラとなるIaaS上にあり、新たに登場したサービスは、この部分を切り出し、ユーザープロビ ジョニングなど幾つかのサービス機能を付加したものだ。仮想マシンとして利用可能なOSは、Windows Server 2003と各種Linux。主な特徴は、①VPN(Virtual Private Network)を利用したセキュアーなVPC(Virtual Private Cloud)の構築、②仮想マシンを利用する複数エンドユーザー向けアクセスコントロール(ID/Password)の設定、③米SAS 70や欧Safe Harborなどへの準拠だ。SAS 70は、SOX法でアウトソーシングなどを行う外部企業の内部統制を第三者が監査する規定である。


OpSource Cloudは、新たに作り上げたわけではない。
実 績のあるSaaSの土台を開放したものだ。8月末に限定β版がリリースされ、10月5日から公開βとなった。この短期間のステップアップも実績ならではの ことである。当面の目標はAmazon EC2のキャッチアップだ。そのためには、SaaSで培った多くの機能を提供し、マーケティングには、世界中に販売のためのパートナーを構築する。公開β 後、オーストラリアのPacTec、そして日本のビープラッツ(株)がパートナーになることが決まった。ユーザーによる評価がまさに始まろうとしている。

2009年10月20日火曜日

企業向けパブリッククラウド市場予測
-Enterprise Public Cloud Adoption- 

調査会社のIDCから昨年に続き、企業向けPublic Cloudの市場予測が発表された。
対象となったのは、①アプリケーション・ソフトウェア(Application Software)、②アプリケーション開発/適用ソフトウェア(Application Development and Deployment Software)、③システムインフラ・ソフトウェア(Systems Infrastructure Software)、④ディスクストレージ、⑤サーバーの5つのカテゴリーである。

下段の昨年度調査と比べて、大きな変化は見られない。
昨年度(2008年)の全世界のIT総経費$383.274Bに対し、企業利用の外部クラウド(Enterprise Public Cloud Computing)は4%に当たる$16.235Bだった。そして5年後の2012年には総IT経費$493.713Bに対し、9%の$42.270Bと増加する。Enterprise Public CloudのCAGRは27%という見通しだった。

今回の調査では今年度(2009年)の全世界IT総経費が約$376B、対してEnterprise Public Cloudは$17.4Bとなって、昨年調査と同様に4%となる。5年後の2013年には、総IT経費が約$493B、Enterprise Public Cloudは$42Bとなって9%を占め、CAGRでは27%の成長となる。

このように昨年と今年の調査で大きな変化は見られず、依然としてCloud Computingは底堅いというのが結論のようだ。5つのカテゴリーを5年間の推移でみると、数字ではアプリケーションが49%から38%に減って、アプリケーション開発/適用ソフトウェアが10%から13%へと伸びる。この変化で考えられるのは、想像の域を出ないが、Cloud Computingのうち、SaaSが頭打ちとなり、IaaSやPaaSが伸び始めるという予想だ。
次いで、インフラソフトは20%と変わらず、ハードウェアではサーバーがやや増加(12%→15%)、ディスクは大きく増加(9%→14%)する。



以上のように、Enterprise Public Cloud Computingは堅調に推移しそうだが、5年後の10%という数字が大きいか、小さいのかの判断は難しい。何故なら、Enterprise Private Cloud Computingがどうなるのかが気にかかるからだ。


-参考-
最後に、この調査の前提となった『Cloud Serviceとは何か』について、IDCの定義を紹介する。
①Shared Standard Service-1ユーザーではなく公共のマーケットを創造するものであること、②Solution-Packaged-必要なリソースを統合したターンキーとして提供できること、③Self Service-アドミン/プロビジョニングがセルフで出来、オンボードのサポートがあること、④Elastic Scaling-動的な拡張性を持っていること、⑤Use-Based Pricing-メータリングのよる利用量払いであること、⑥Accessible via the Internet/IP-インターネット経由でユビキタス利用が可能なこと、⑦Standard UI Technologies-標準のBrowserやRIA(Rich internet Application)が利用されていること、⑧Polished Service Interface/API-洗練されたインターフェースやAPIがつかわれていること。

2009年10月18日日曜日

クラウドコンピューティング・サーベイ
-大手企業対象-

アプリケーショントラフィック管理のF5 Networksから大手企業を対象とし たCloud Computing Surveyが出た。対象となったのは全世界で2,500人以上の従業員を持つ250社の民間企業だ。平均はなんと75,000人というから超大企業対象 調査である。回答者は、実務的なIT部門のManagerが37%、VPが24%、Directorが23%、そしてSVPは16%、CIOは含まれてい ない。以下は調査報告書からの主なポイント(Key Finding)である。


◆ ONE - Cloud Computingの定義はバラバラ、そこで統一見解を作成

まず、いつもながらのことだが回答者のCloud Computerに関する定義はまちまちだ。この調査では回答者から下図の下段に見られる幾つか代表的な定義を出してもらい、それについて全員が5段階の 評価をつけた。5段階とは、①完全に一致している(Perfect, This definition nails it) 、②大体あっているが一部欠落や間違いがある(Almost there, but there are a few parts missing or incorrect)、③約半分は正しい(This is about half right)、④一部は同感だが殆どは違う(I agree with a few things, but mostly not)、⑤この定義には同感できない(There is nothing I agree with in this definition)だ。調査の結果、①完全に一致(Perfect)と②大体あっている(Almost there)の合計が68%以上を獲得し、ほぼこれに近いと思われた定義は、以下の2つである。

• クラウドコンピューティングは、自営データセンター外の仮想ITリソースをオンデマンドで利用し、他との共用、簡単な使用法、サブスクリプション払い、そしてWeb越にアクセスするもの。(Cloud computing is on-demand access to virtualized IT resources that are housed outside of your own data center, shared by others, simple to use, paid for via subscription and accessed over the Web.)

• クラウドコンピューティングは、動的な拡張性を持ち、往々にして仮想化リソースを用いるコンピューティングスタイルで、インターネット越にサービスとして提供される。利用者はクラウドの知識や経験、インフラの制御などは必要としない。(Cloud computing is a style of computing in which dynamically scalable and often virtualized resources are provided as a service over the Internet. Users need not have knowledge of, expertise in, or control over the technology infrastructure in the “cloud.”)



調査では、この結果に終わらず、新たにIT ManagerやNetwork Architect、そしてCloud Service Providerを含めたグループを結成、回答者の意見を踏まえて誰でもが解るCloud Computingの定義を議論、以下のような統一見解を作成した。

-クラウドコンピューティングとは-
クラウドコンピューティ ングは、動的な拡張性を持ち、往々にして仮想化されたリソースを用いるコンピューティングの形式で、インターネット越にサービスとして提供される。利用者 はクラウドの知識や経験、インフラの制御などは必要としない。さらにまた、クラウドコンピューティングは可用性や利便性を持ち、オンデマンドネットワーク アクセスで共用される構成可能なコンピューティングリソース(例えばネットワーク、サーバー、ストレージ、アプリケーション、サービスなど)を利用するモ デルで、最小限の管理努力とサービスプロバイダーとのやり取りで迅速な適用やリリースが出来る。
(Cloud computing is a style of computing in which dynamically scalable and often virtualized resources are provided as a service. Users need not have knowledge of, expertise in, or control over the technology infrastructure in the "cloud" that supports them. Furthermore, cloud computing employs a model for enabling available, convenient and on-demand network access to a shared pool of configurable computing resources (e.g., networks, servers, storage, applications, services) that can be rapidly provisioned and released with minimal management effort or service provider interaction.

余談だが、後半部分は既報<NISTクラウド定義とGSAの要求仕様 9/29NISTの定義を付け加えたもののようである。


◆ TWO - しかしCloud Computingは浸透

Cloud Computing定義の混乱は、ともかく、大企業においてCloud Computingは着実に浸透している。調査では、何と99%の回答者が導入の議論中か、適用、運用中などのステージにあることが解った。以下2つの図 はPublic CloudとPrivate Cloudについての段階調査だが、Public Cloudでは82%が試行(Trials)か適用中(Implementing)、ないし本番中(Using)と答え、Private Cloudでは同様の段階にあるものが83%となった。しかもPublic Cloudは51%が何がしかのアプリケーションで使用中であり、Private Cloudでも45%が利用しているという回答には目を見張る。そして66%のIT ManagerはCloud Computing向けの特別予算(Dedicated Budget)を持ち、71%は今後2年間、この予算は伸びると回答している。


◆ TREE SaaSより、PaaSやIaaSが重要

一 般にCloud ComputingとSaaS(Software-as-a-Service)は同等視の傾向があるが、IT Managerの回答では、SaaSはCloud Computingの重要な要素ではあるが、最も重要だとは見なしていない。回答者の4分の3(75%)は、Cloud ComputingにはPaaS(Platform-as-a-Service)が通常、または常に含まれるとし、その上、3分の2 (66%)はIaaS(Infrastructure-as-a-Service)もCloud Computingに通常、または常に含まれるとした。対して、5分の3(60%)がSaaSは通常、または常にCloud Computing含まれると回答した。つまり、IT ManagerにとってのCloud Computingとは、PaaS→IaaS→SaaSの順のようである。

◆ FOUR 気になるコアテクノロジーと狙いは何か

関 連予算の増加に伴いIT ManagerはCloud Computingのインフラ構築技術の調査に余念が無い。5段階評価に従い、より詳細に見ると、回答者が最重要だと答えたのはアクセスコントロール 90%、次がネットワークセキュリティー89%、サーバーとストレージの仮想化88%の順となった。そしてCloud Computingに向かう狙い(下図)としては、①経済性(Efficiency)がPublic Cloudで77%(Privateは45%)、②IT資本コスト削減(Reduce Capital Costs)がPublicで68%(Privateは63%)、③運用費用の削減(Reduce Operating Expenses)がPublicで51%(Privateは45%)、④迅速性がPublicで58%(Privateは51%)などなった。

◆ Cloud Computing予算を分析する

増加傾向にあるCloud Computingの予算とは、ITインフラの整備は想像がつくにしても、その他は実際、誰が予算を持って、どういう分野に使うのだろうか。回答者による と、64%の予算はやはりITインフラの整備であった。次にアプリケーション開発(Application Development)とネットワーク(Network Architect)が各々13%、残りはサーバーグループ(Server Group)と業務部門(Business Owner)が5%づつとなった。また、PublicとPrivateを分けた数字では、Public Cloudに関する予算のトップ3は、①ITインフラが45%、②アプリケーション開発が41%、③事業別部門LOB(line of Business)が41%となり、Privateでは、①ITが45%、②LOBが36%、③アプリケーションが24%となった。


この調査を見る限り、Cloud Computingは大企業でも大きく取りあげられていることに驚かされる。これまでCloud Computing、特にPublicはデベロッパーと共に進展し、主に中小企業への浸透が進み、大企業ではこれからとの印象があった。だが、状況は我々 の想像を超えていたようである。こうなると、エンタープライズ市場を制するのは誰かがポイントだ。大手ITベンダーなのか、Hosting Businessに長けたデータセンターなのか、はたまた、AmazonなどCloud Computingを引っ張っていた新規参入組なのか、本格的な戦いが始まっている。

2009年10月10日土曜日

クラウド・コンセンサス・サーベイ
-政府系と民間企業-

連邦政府のITコミュニティーとして、ソシアルネットワーキングを運営するMeriTalk
から、政府系と民間を半々としたクラウド・コンセンサス・サーベイ(Cloud Consensus Survey)が発表された。調査対象となったのは、政府系と民間のIT責任者605人。政府系では一般業務関連(Federal Civilian)から25%、国防関連(Department of Defense)から25%、そして民間(Industry/Business)から50%の分布であり、職群ではCIO/CTO(含む副-Deputy、補佐-Assistant)が22%、IT部門の部課長(Director/Supervisor/Manager)が67%、その他の IT管理者が11%、所属する組織サイズは34%が1,000人以上、501~1,000人までが30%、251~500人までが13%、101~250 人までが7%、100人以下が16%となっている。

◆ Cloud Computing定義の混乱

まずCloud Computingには関する理解では、この言葉の正確な定義がなく、多くのベンダーやメディアが広範囲に使っていることもあって混乱が見られた。曰く 「仮想環境下でサービスやインフラ、アプリケーションを提供するコンセプト」、「コンピュータ業務に用いられるコンピューティング資源の大まかな定義セッ ト」、「サービス提供のアーキテクチャー」、「ユーザーにサービスとして販売する資源管理、これを利用すれば自社データセンターは持たなくても良い」、 「Webベースのアプリケーション」、「サービスやインフラのリモート提供でローカルの資源として利用」、中には「クライアント側はクラウドではないが取引が発生すればクラウド化する」、「インターネットの言葉の置き換え」などなど。またベンダーによるSaaSやIaaS、PaaSなどの宣伝も混乱要因となっている模様だ。

◆ Cloud Computingは定着し、30%が何らかの実施に向けた段階

このような状況にもかかわらず、Cloud Computingは定着の方向にある。
政府系回答者の76%(民間では51%)はCloud Computingは定着していると考え、61%が5年以内にコアアプリケーションが移行されるとしている。

下図はCloud Computingの取り組み状況を示したものであるが、現段階で最も多いのは、官民とも約半数強(政府系は46%、民間48%)が技術的な調査・研究段階にあり、既に始めているところは共に13%、デザイン段階にあるのは政府系が10%-民間は8%、適用段階は政府系が7%-民間が8%となった。整理すると、政府系で何らかのクラウド実行に向けた段階(デザイン、適用、本番)にあるのは30%となり、民間は29%、そして各々約半数が調査中であることから、今後は急速に進展することが予測される。また、部分的なクラウド利用では、データベースが44%、ドキュメントは42%、自社内の仮想化技術適用は28%となった。



◆ Cloud Computingのベネフィットは費用削減

次に政府系機関のCloud Computingに関するベネフィットは以下の通りとなったが、最も期待が高かったのは、①ハードウエア費用削減で57%、②使用量払いによる費用削減が45%、③スタッフ費用の削減が35%となり、ここまでは民間も同じだ。
次いで、④融通性が33%(flexibility)、⑤グループコラボレーションの可能性が24%(Potential for Group Collaboration)、⑥運用計画の継続性が22%(Continuity of Operations planning)となった。そして、官民共に63%がCloud Computingはコスト削減の切り札だとし、適用した官民の機関では90%が成功していると回答している。


◆ セキュリティーだけでなくクラウドにも不安

しかしながら、一方で課題も多い。
課題は大別すると2つ。ひとつは、インターネット固有のセキュリティーとプライバシー。
調査ではセキュリティー不安が78%と抜けて高く、次いでプライバ シーが41%となった。もうひとつはCloud Computingそのものに関するもの。まずクラウドで本当にコスト削減が出来るのかという疑問が24%、そしてすべてのやり取りがインターネット経由 となることからバンド幅は大丈夫かが24%、また、パフォーマンスに関するものが19%となった。


◆ 今後5年間の見通し

官民ともCloud Computingの将来については楽観的だ。
Public とPrivateのクラウドを比較すると、現在の利用は、政府系のPrivate利用が28%(民間は26%)でPublicは8%(民間は11%)となって、政府系はPrivate Cloudの利用が高く、民間はPublic Cloudの利用が高い。しかしながら、将来的には逆転し、政府系のPrivate利用は41%、民間は46%となり、政府系のPublicは27%で民間は41%と見込まれる。これらから、現状だけでなく、将来に亘っても政府系はややセキュリティーなどで神経質となってPrivate Cloud傾斜が強いことがわかる。

最後に今後5年間のクラウドアプリケーションに関する調査がある。
この調査は、主要アプリ ケーションが5年間で、これまで通り自営データセンターで実行なのか、もしくはクラウド(PublicかPrivateか)か、または不確かを区分するもの。総合的に見ると、e-mailアプリケーションがクラウド化される確率が最も高く60%を超えた。また、購買(Procurement)やERP、CRMも50%近くの確率でクラウド化との結果だ。これらの基幹業務が移行されるのは驚くべきことだが、SalesforceやSAPなどのクラウド化が 着実に浸透してきていることが背景にあるものと思われる。もっともシビアーな会計(Accounting)業務も40%以上の確率でクラウド化が進む見通しだ。


以上のように、MeriTalkのクラウド調査は大変興味深い。
Cloud Computingはもう話題の域を抜け、官民ともに30%がステージこそ違え、クラウドの実行に踏み出している。課題は2つ、ひとつはインターネットに関するもの、他はクラウド技術についてだ。これらは我々がこれまで経験してきたようにメリット/デメリットのバランスの上にある。そして、ユーザーに とって最大の期待は費用削減である。

2009年10月3日土曜日

連邦政府のクラウド推進計画(3)
-Data.govからNASA Nebulaまで-

連邦政府のクラウドシリーズ最終回は、その他の事例を見ていこう。

◆ Data.gov

まずData.gov。 このサイトは、連邦政府のCIO Vivek Kundra氏が就任後、実行した3つ(Apps.gov、Data.gov、Federal TI Dashboard)のうちの1つ。勿論、連邦政府のクラウドの柱となるApps.govが目玉だ。そして、このData.govはApps.govに近 々移行が予定されている。Data.govは、政府系機関が持つ情報を市民向けに開示する目的で作られた。画面から解るように、①生データ(Raw Data Catalog)、②分析ツール(Tool Catalog)、③地域別データ(Geo Data Catalog)がカタログとして提供される。これを用いてユーザーとなる市民や団体は、自由な加工や分析が出来る。対応するデータには、連邦政府提供の ものと州政府のものがあり、5月末に本番開始、州政府のデータは、現在、カリフォルニア州、ユタ州、ワシントンDC、今後、段階的に拡大が予定されている。



◆ Fedral IT Dashboard

次にFedral IT Dashboardを紹介しよう。
こ のサイトは、連邦政府の主要機関(国防省-DOD、国土安全保障省-DHS、商務省-DOC、財務省-Treasury、運輸省-DOT、司法省 -DOJ、退役軍人庁-VA、農務省-USDA、エネルギー省-Energy、その他-Others)のIT投資についてビジュアルに見ることができる。 上部にある5つのタブ(Home、Investments、Data Feeds、Analysis、FAQ)のうち、Data Feedsを用いると、独自のスナップショット画面の作成ができ、それを保存したりWebにあげることが出来る。


ま た、Analysisには「Trends」と「Current Year」のオプションがあり、Trendsでは複数省庁を選択した比較や傾向分析が可能だ。Current Yearのオプションを使うと、今年度の総IT投資がどの省庁のどのようなサービスに使われるのかという総マップ(下図)が表示される。




◆ DoD Forge.mil

さて、3つ目は、米国防関連の情報処理機関DISA(Defense Information Systems Agency)が主導するForge.milだ。 このサイトは昨年10月からスタート、現在は軍用のSourceForgeにあたるSoftwareForgeが利用できる。この SoftwareForgeは、国防省DoD(Department of Defense)仕様のセキュリティー基準に合わせ、DoD内のオープンソース開発を促進するものだ。利用にあたっては、DoD Common Access Card (CAC) かDoD 認定の ECA (External Certificte Authority)発行の PKI 証明書が必要。現在、利用はDoDコミュニティーに限定されているが、いずれは関連ベンダーまで広がる模様だ。開発後のソースコードは公開が予定されてい る。

DISAのクラウド推進計画DISA Cloud Computing Initiativeが始まったのは昨年始めのこと。大事な国防対応のクラウドはどのような技術で構築すべきかがポイントとなった。仕事柄、特定のベン ダーに依存することなく、かつ独自性のあるシステムでなければいけない。それには出来るだけオープンソース製品を利用してカスタマイズし、全てを自らの手 の内に置くことだ。しかしながら、機密第一の国防とオープンソースの距離は遠い。まずは、これまでのような選任チームではなく、DOD内のコミュニティー に開発の輪を広げたオープンソース開発に慣れることだ。こうしてSourceForgeが始まった。

第1弾となったSoftwareForgeは、DoDのFirewall内でクラウドを利用したオープンソース開発を促進する。その結果を見極め、次のクラウド化へ向かう。



◆ NASA Nebula Cloud Computing Platform

最後に紹介するのはNASA Nebulaだ。
Nebula は、シリコンバレーのNASA Ames Research Centerで開発されているクラウドシステムである。無限の仮想マシンが星となった星雲を意味するNebulaとはいかにもNASAらしい。このシステ ムは、DISAのオープンソース戦略をさらに進め、各種のオープンソースをシームレスに結合して、セルフサービス方式で利用するもの。機能的には、これま での仮想マシンを 大きく超えるHigh Capacity Computingを目指し、CPUだけでなく、ストレージやネットワークの仮想化も計画している。


Nebulaの提供するサービスは、IaaS/PaaS/SaaSの3つ。
下図の下段部がIaaSの構成部分で、仮想マシンを作り出す仮想サーバー、その上に仮想マシンを連結させるメッセ-ジングのRabbitMQとシステム内検索にSolrの採用が予定されている。また、ファイルシステムは2つに対応。ひとつは2007年にSun Microsystemsが買収したCluster File Systems開発の並列大規模分散ファイル処理Lustre(Luster File System)、もうひとつはクラスタリングされたMySQLだ。そして、プロビジョニングはU.C. Santa Barbaraで開発されているEucalyptusだ。Eucalyptusは、Amazon Web Service(AWS)と互換APIを持つことから、これを使えば全てのAWSツールの利用やEC2からの移行が簡単にできる。



上図の上段部がPaaSとSaaSにあたる。
PaaSは開発や実行環境を整備したプラットフォームであり、SaaSは主としてWebアプリケーションを実行する。Nebulaではアプリケーション開発言語をJavaとPythonに絞り、Python FrameworkにはDjangoを 採用。Nebulaに限らず、クラウドで稼動させるWebアプリケーションの厳密な開発は容易ではない。例えば、対応するブラウザやOSの幾つかのバー ジョンなどを組み合わせたテストをしなければならない。このためNebulaでは、並列処理のグリッド技術を用いたテストツールCelenium GRIDを組み入れ、これによって、並列組み合わせテストが実行する。そして本番にあたっては、Webサーバーの高速化を促すアクセラレータVarnishも組み込まれている。


こうして提供が始まったNebulaは、現在のところ、ユーザー限定のβ版だ。
アプリケーションは、NASAアクティビティーに関連する外部との教育やコミュニケーションがメインだ。例えば、アマチュア天文学者が撮った高解像度写真のアップロード、 月面衝突探査機エルクロスLCROSS( Lunar CRater Observation and Sensing Satellite)のサイトが稼動中だ。このLCROSSサイトは、天文学ファンとNASAの科学者がインフォーマルな作業をする共同サイトである。 LCROSSのミッションとは、月面の水の存在を探し出すこと。そのために月面に探査機を衝突させ、その際に舞い上がるダストを高解像度画像として撮影 し、それを解析して水の存在を確認する。9月30日に発表された最終情報では、ターゲットとなるクレータがカベウス(Cabeus)に変更になり、衝突実 行日は10月9日早朝(PST)となった。

Nebulaの構成要素はすべてオープンソース。
それらをシームレスに結合すること で、素晴らしいクラウドが登場した。①GSAのクラウド(Apps.gov)は一般省庁向けでインフラのコスト削減を狙い、②DISAのクラウドは国防シ ステム開発の効率化を目指し、③NASAクラウド(Nebula)は科学分野で世界中の科学者やアマチュア天文学者との連携を図る。これら3つのクラウド の成長を見守りたい。