2014年2月19日水曜日

BashoのRiakとは何か?    -SDS7-

このSDS(Softesre-Defined Storage)シリーズも第7回目。
今回と次回は、Web時代にとって有用なオブジェクトストレージについて取り上げる。まずは風変わりな名前のスタートアップBasho Technologiesだ。この名前は創業者のひとりが俳句に造詣が深く、それで芭蕉(Basho)にしたと聞く。ちなみに、俳句は今やそのまま英語“Haiku”で通じるほど人気は高い。クラウドの世界でも、Hero(ヒーロー)とHaiku(俳句)をもじった社名Herokuというプロバイダーがあるし、前Sun CEOだったJonathoan Shuwartz氏も英語の俳句を作っていた。さてBashoだが2008年、同じボストンに本拠をもつAkamaiのエンジニア達が興した会社である。彼らが試みたのはAmazonが出したDynamoに関する論文の製品化だ。目指すはエンタープライズには欠かせない耐障害性と無停止運転である。

=4つのRiak製品=
Bashoの開発したオブジェクトストレージがRiakだ。Bashoの開発チームは、Riakを分散環境に適合させて、その上で高信頼データベース化を追及した。彼らの製品は4つある。まず、元祖オープンソースのRiak。勿論、無償で利用でき、1クラスター構成となる。ここで言うクラスター(後述)とは1つのデータセンターと考えても良い。次に有償版のRiak Enterprise。これにはマルチクラスター間(マルチデータセンター間)のレプリケーション構築と24x7のサポートサービスが付いている。この異なるセンター(クラスター)間でのレプリケーションは高可用性を追求するRaikの大きな特徴だ。さらに、AWS S3互換のRiakをベースとしたRiak CS(Cloud Storage)。これにも無償シングルクラスター版と前述のマルチ機能(レプリケーション)でサポート付きの有償版(Riak CS Enterprise)がある。このRiak CSを利用すれば、S3で作られたアプリケーションの移行が出来るし、同じインターフェースのオンプレミスやクラウドアプリケーションを作ることも可能だ。CSはまた、マルチテナントでもあるため、プロバイダーや大企業での採用が多い。

=Riakの仕組み=
さて、基本となるRiakの仕組みを見ていこう。まずRiakは分散システムだと述べた。このランタイムは配備された幾つかのサーバーのErlang/OTP で稼動する。これらサーバーのひとつひとつをノードと言い、複数ノードからなるクラスターがRiakデータベースを構成する。クラスター内では各ノードは平等なP2Pの関係にあり、新たにノードを参加されることも容易である。蛇足だが、並列処理言語Erlangは開発元のエリクソン社のEricsson Languageが名前の由来だが、実際は、並列計算処理で重要な待ち行列理論の数学者Agner Erlangにちなんだものらしい。OTPはエリクソン社が電話交換機用に開発した分散環境のプラットフォームで、耐障害性や無停止運用に強い特性を持つ。Riakのデータ構造をもう少し詳しく見よう。
Riakのデータ管理はKey-Value Store。個々のKey+Valueからなるデータはバケットに入れられ、分散環境の複数サーバー(クラスター)のノードに保存される。バケットはKeyを分類するための名前空間で、Bucket/Keyからハッシュ関数計算して、分散保存するノードを決める。実際の構造はもう少し細かく、各ノードは仮想ノード(vnode)に分割されて、ハッシュ値からvnodeが決められる。vnodeはさらに複数のPartitionに分けられており、分散をより確かなものにしている。下図のRingでは160bitのハッシュ空間をP=32個のPartitionで分け、同数のvnodeで配分している。この例では物理ノードは4つだ。

=実際のI/Oと障害対策=
実際の読み書きはどうなるのだろうか。
書き込み(Put)は、障害対策のため、異なる物理ノードの複数vnode(Default=3)に複製される。そして複製がW値(Default W=2)に達した時にアプリケーションに完了を返す。この例では3回の書き込み保存のうち2回が終われば成功だとみなす。読み込み(Get)も、事前に設定されているR値(Default=2)回の読み込みが出来るとアプリケーションにデータを戻す。このようにRiakは、データの自動複製、さらには障害vnodeの自動回避や自動復旧機能を用いながら、耐障害性について、完璧な対応をしている。また DRなど更なる障害対策のために、クラスター間でリプリケーションを行うことも出来る。下図はノードから見ることが出来るクラスター管理コンソールの画面例だ。ノードは親が無いP2Pなので、どのノードからも同じ画面が見れる。


以上、見てきたようにRiakは耐障害性と運用の容易性にこだわった製品である。
周知のように、AWSで提供される各種サービスは魅力的だが、一度それらを使って開発をすると、他システムへの移行は難しい。つまり、AWSは便利だがベンダーロックインの側面も持ち合わせている。その意味でRiakおよびRiak CSの登場は、AWSの保守性をブレークスルーさせ、且つより高い信頼性をユーザーにもたらす可能性を秘めている。Riakは既にFortune 50の25%に浸透していると聞く。

2014年2月11日火曜日

IBMの進撃が始まるか、SoftLayer!     -IBM2-


前回、IBMの事業再編とクラウドシフトについて述べた。
今回はその核となるSoftLayerとは何かについて、考察しようと思う。
これまでに解ったことは、① SmartCloudサービスのIaaSにあたるSmartCloud Enterprise(SCE)は既にSoftLayerに移行が済んだということだ。これは1月末までに完了した。さらに上位のSCE+はSmartCloudのブランド下にあったが、これは別物で継続する。そして、更なるSoftLayerの普及に向け、 IaaSのSCEだけでなく、② SmartCloud Application Services(PaaS)やSmartCloud Solutions (SaaS)もSoftLayerに移行する。これらとは別に、③ WatsonのクラウドサービスもSoftLayer上での展開が予定されている。つまり、これからはSoftLayerがIBMクラウドの主役となる。

=SoftLayerの強みは何か=
SoftLayerの設立は2005年。
SoftLayerは世界140ヶ国に22,000顧客を持ち、地域的にみると米国とその他(米国外)がおおよそ50%づつ。データセンターは全世界に13ヶ所(Huston, Dallas, San Jose, Seattle, Washington DC, Singapore, Amsterdam, ... )、これらセンター間は20Gbpsの光ケーブルで接続されている。さらにアクセスポイントとなるNetwork POPを米国、ヨーロッパ、アジアに17ヶ所に設置(下図)。IBMはこのネットワークを既報のように世界40データセンターに拡大予定だ。彼らの強みは、大別すると2つ。まず、この高速専用ネットワーク回線がCDN(Content Delivery Network)や後述のDRとして機能すること。まるでAkamaiとAWSを結合したシステム作りである。もうひとつは、その上で稼動する拡張性の高いクラウドシステム(CloudLayer)だ。


SoftLayerのサービスには、①Dedicated, ②Managed,  ③CloudLayerの3つがある。これらは同じ統合環境(Integrated Environment)で稼動するので、組み合わせたシステム構築や総合的な運用が可能だ。ここで“Dedicated”とは、Dedicated Serverのこと。ユーザーはこのサービスを選択することで、SoftLayerのデータセンター内に専用のマシンを確保し、通常のVirtual ServerやPublic Cloudより安全で高速な実行環境を持つことが出来る。ただしSelf Managementだ。この場合、CPUはSingle(x1)からDual(x2)、Quad(x4)、Hex(x16)、そして必要ならNVIDIA Tesla GPUを搭載したHPCだって選択が可能だ。“Managed”は運用管理をSoftLayerが行うManaged Hostingのこと。

CloudLayer - On-Demand Cloud Computing 
同社が提供するCloud Computingのプラットフォームは“CloudLayer”。
セールスポイントは“Seamless & On-Demand Computing”である。仮想化のHypervisorはXenServerだ。大きな機能は3つ。ComputingとStorage、そしてCDN。このCloudLayerを用いれば、前述のDedicated ServerやVirtual Server、そしてCloud環境をシームレスに且つオンデマンドで統合して実行することができる。まさに理想の統合コンピューティング環境(Unified Computing Environment)だ。利用にあたってはPublic Cloud Instance、Private Cloud Instance、Bare Metal Cloudのオプションがある。ここでPublic CloudはMulti-Tenant、PrivateはSingle Tenant、Bare MetalはもちろんSingle Tenantだ。利用できるインスタンスはPublic Cloudで1 Core + 1GB RAM + 25GB Local Storageから8 Core + 8GB RAM + 100GB Local Storageまで、Privateでは8 Core + 32GB RAM + 100GB Local Storageまで、Bare Metalは最大16 Core - 64GB Ram - 250GB HDDまでの中から選択出来る。利用料金は月額か時間割りが選択が可能だ。

StorageLayer - Geographic Object Storage
CloudLayerの提供するストレージも凄い。基本となるのはOpenStack SwiftベースのObject DBだが、地理的配置が可能だ。このストレージは仮想マシンイメージやフォト、eメール、アーカイブなどの保存に優れ、①IndexとKey-Valueによる高速検索(Integrated Index & Search)、②北米/欧州/アジアを結ぶストレージクラスタリング(Global Storage Cluster)、③複数書き込みによる自己復旧(High Availability)、④ストレージ/CDNから直接コンテンツ配信)(Flexible Data Distribution)、⑤ポータル/モバイル/RESTful APIによるフルアクセス(Powerful Management Tool)などの特徴を持つ。ストレージデバイスには、CPUに付帯するLocalとSANがあり、FTPやNAS、iSCSIなどでアクセスする。さらに同社のネットワークとデータベースの地理的配置を組み合わせれば、DRのためのData Replicationも出来る(下図)。このSANシステムのオプションは1 Core + 1GB RAM + 100GB SAN Storageから8 Core + 16GB RAM + 100GB SAN Storageまで用意されている。


CloudLayer - CDN(Content Delivery Network)
SoftLayerが持つ世界展開の13データセンター(40センターに拡大予定)とそれらを繋ぐ専用高速回線(Private Network)は大きな戦略資産である。各データセンターには地域展開のSANストレージを配備した。これらを使ったCDNは容易に想像できるだろう。コンテンツを利用ユーザーのもっとも近いセンターのSANストレージに配置する。同社のネットワークはPrivate VLANとして機能するのでセキュリティーでも万全だ。コンテンツ処理は、“Origin Pull”と“PoP Pull”の2つ。“Origin Pull”とは、初回のコンテンツ要求時にホストサーバーから持ってこられ、その後、他ユーザーのアクセス用にネットワークに留まるもの。“PoP Pull”の場合は、予め本来の場所から目的とする場所にFTPなどでプリロードするものを言う。利用料は、Origin PullではGB単位の使用帯域料金となり、PoP Pullでは加えてストレージ料金がかかる。

進撃が始まるか!
以上見てきたように、SoftLayerは優れものである。
IBMは巨額を投じてきたSmartCloudを止め、SoftLayerに乗り換える。速報によると、IBMのクラウド売り上げは2013年度$4.4B(約4,400億円)、前年比69%のアップだ。昨年秋のIDC Reportでは、Cloud Professional Serviceのトップ企業に選ばれた。クラウドのSIでは世界一というわけである。IBMは今年から本格攻勢に入る。 しかし、クラウドビジネスが上手く軌道に乗れば、裏腹にハードウェア売り上げは下がる。これははっきりしている。先月、x86事業をLenovoに売却したが、WSJは更なる事業売却にも言及した。このバランスをどう舵取りをするのかCEO Ginni (Verginia) Rometty女史の手腕が問われる。目標は2015年までにクラウド売上を年間$7B(約7,000億円)に拡大することだ。巨人IBMでも開発が出来なかった斬新なクラウドをスタートアップが成し遂げ、巨人は時代の変遷に合わせて、外部の力を借りながら事業再編に命運を賭ける。クラウドとはそんな厳しい時代でもある。

2014年2月4日火曜日

IBM、クラウドを核に事業再編へ!        -IBM1-

IBMがクラウドを核に事業再編成に動き出した。次世代に向けた体力作りである。
2011年6月、創業100年を迎えたIBMに、昨年1月、初の女性CEO Ginni (Verginia) Rometty女史が登場した。振り返れば、80年代後半、メインフレームからPC時代への変遷の中で苦戦し、1992年度に巨額の損失を出した。それに伴いCEOをJohn Akers氏から初の外部招聘のLouis Gerstner氏へスイッチ。さらに2002年には、Samuel Palmisano氏を選任。彼の在任は10年に及び、それまでのハードウェア主体ビジネスをソフトウェアとサービスへ変革させ、年率20%成長の会社へと導いた。その彼がクラウド参入を発表したのは2009年。Smart Business構想(関連記事)である。 

=クラウドがビジネスの核に=
IBMはどうやら本気のようだ。
IBMがオンデマンドサービスを全世界のデータセンターで展開し始めたのは2000年代初頭のこと。これはGrid ComputingからUtility Computingへの流れに沿ったもので、Cloud Computingに成長した。2009年に姿を現したIBM Smart Business構想は、今から見れば、クラウドのアプローチ段階であったが、ともあれ、これがこれまでIBMが力を入れてきたSmartCloudの基点である(尚、日本国内向けにはSmarterCloudという)。IBMはこのSmartCloudの普及に向けIaaS(SmartCloud Enterprise)だけでなく、PaaSに当たるSmartCloud Application ServicesやSaaSのSmartCloud Solutions、ハード/ソフトを含めた企業向けクラウド構築パッケージSmartCloud Foundation、3rdパーティーソフトの活用を目指したSmartCloud Ecosystemなどの整備を進めた。2013年5月にはオープンクラウドとの連携を睨んでIBM SmartCloud Orchestratorを発表し、同6月、米パブリッククラウド大手プロバイダーのSoftLayerを買収した。
このSoftLayerはSME(Small & Medium Enterprise)での実績が多く、かつ、機能的にも優れものだ。これについては次回に述べよう。さて、IBMのラウドビジネスは上手く行っているとは言い難い。この流れをSoftLayerで断ち切りたい。そんな願いを込めて、今年初め、IBMはSmartCloudをIBM Cloudへと名称を変更。そして1月17日、グローバルクラウドのために$1.2B(約1,200億円)を投じて世界展開するデータセンターを拡充すると発表した。これにはSoftLayerの既存13のデータセンターとIBMの12データセンターが含まれ、新設が15センター、合計、年末までに40データセンターとなる。5大陸をカバーし、世界15ヶ国にまたがる巨大システムが動き出す。


=Watosonもクラウドへ=
Watsonも動き出した。
IBMの開発した人工知能コンピュータWatsonはクイズ番組Jeopardy!に挑戦するために2009年に登場した。その前身はチェスで世界チャンピオンに勝ったDeep Blueである。1月9日、IBMはクラウド型Big Data解析サービスを開発するWatson Groupの組織化を発表。このプロジェクトは2,000人のエンジニアの英知を集めて、複雑な問いから思考と学習を繰り返して、必要とする答えと洞察を導き出す。Watson Groupでは、これをBigDataのCognitive Innovation(認知革新)と言い、3つのクラウドサービスを開発予定だ。まず「Watson Discovery Advisor」は製薬・出版向けData Driven Contentの情報解析サービス、次に「Watson Analytics」は自然言語ベースの会話型解析システム、そして「Watson Explorer」は 一般企業向けのBig Data分析サービスとなる。新しいWatson Groupのオフィスは、西のSlicon Valleyと並ぶ東海岸マンハッタンのSlicon Alley地区(51 Astor, New York )。投下資金の総額は$1B(約1,000億円)、うち$10M(約100億円)は、外部企業とのエコサイクル構築へ向けたベンチャーファンドとしてStartupなどに投下される予定だ。 

=x86事業売却へ=
次いで、1月23日、IBMはx86サーバー部門をLenovoへ売却すると発表した。
これに先立つ、21日に発表された2013年度決算は利益が予想を上回ったものの、売上げは前年比5%減の$99.8B(約9兆9,800億円)となった。主要因はハードウェア部門の伸び悩みだ。今回の売却が関連していることは明らかである。Lenovoへの売却総額は$2.3B(約2,300億円)、これには、System xBladeCenterFlex System blade server & スイッチ、x86ベースのFlex System Integrated SystemsやNextScaleiDataPlex、さらに付帯関連ソフトウェアと保守業務が含まれる。結果的にIBMに残るハードウェア製造は、POWER7系のメインフレームSystem zとPOWERサーバー、そしてストレージシステムのみとなった。

=CEO ギニー女史の決意=
この決算発表でCEOのGinni Rometty女史は、「IBMの最大の挑戦は、Watsonやアナリティック、電子商取引、モバイル、クラウドなどの分野を急速に成長させて、不採算部門を埋め合わせることだ」と述べた。ハードウェア部門は大方整理がついた。POWER系製品はしかたがない。残るはストレージ部門だけだ。周知のように、2002年末、ディスク製造部門は日立に売却、そのHitachi Global Storage Technologiesも2011年3月、Western Digitalへ転売されてHGTSとなった。
しかし、IBMストレージ部門にはSVC(SAN Volume Controller)がある。これはStorage Hypervisorと言っても良い技術だ。これを今やクラウドで重要な要素となったSDS(Software-Defined Storage)に活かせるか、大きなチャレンジだ。
ともあれ、Gerstner氏から始まった脱ハードウェアビジネスは、Palmisano時代に「ソフトウェアとサービス」として花咲いた。言い換えれば、コンサルティングと結びついたSIビジネスである。Rometty女史は、これをさらに徹底させ、クラウドを核にした新たなSIビジネスを目指す。