SCSK LifeKeeper担当 池田です。
みなさんLifeKeeperと言えばどのようなことを思い浮かべますか?
「HAクラスター」「可用性」などの声が想像できますが、ではこの「HAクラスター」や「可用性」の目的は何なのかについて、これまでとは少し違った視点でお話ししたいと思います。
LifeKeeperを導入する目的
LifeKeeperをシステムに導入する目的は各社いろいろあると思います。一般的なものとしては、Activeサーバで障害が発生したとしても、Standbyサーバに切り替わることによって、システムが完全に停止してしまう時間を極小化し、ビジネスの機会損失を最小限に抑えることが挙げられると思います。あるいはawsであれば、Availabilty Zone(AZ)レベルの障害が発生した場合に、別のAZでシステム稼働を継続できるという目的の場合もあると思います。
いずれにしても、障害が起きても業務を継続できることが、主目的になることがほとんどかと思います。
では少し視点を変えて、システムを運用している、ユーザ企業の情報システム部のかたにとって、Lifekeeperが導入されることによるメリットがないか考えてみたいと思います。
情報システム部の方々が受ける恩恵
「LifeKeeperは保険のようなもの」と言われることがあります。事実、いつ発生するか判らない障害の為にお金をかけて、ともすると5年とも10年とも言われるシステム稼働期間中に一度もフェイルオーバが発動しないこともあります。それゆえに「結果的に必要なかったよね」との判断から、次のサーバ更改では不要とされてしまうなんてこともありました。
しかし、冗長化していない1台のサーバで構成されたシステムで障害が発生した場合のことを想像してみてください。障害が発生した場合、サーバが復旧するまでの間、システムは停止し、業務や提供サービスがストップしてしまいます。
もちろん利用者が少ない、あるいは使用頻度が少ないなどの理由で復旧に時間をかけられるシステムでしたら、復旧を焦る必要はないのかもしれません。しかし、もし利用者が多く、使用頻度も高いシステムだったとしたら、夜間休日を問わず早期の復旧と原因究明もという相反する対応を求められることとなるでしょう。
この場合の情報システム部門の方々へのプレッシャーはとてつもなく大きなものになります。
一方、可用性が確保されたシステムの場合、障害が発生したとしても、一時的なシステム停止は生じるものの、もう一台のサーバでシステム利用できることから、復旧最優先という呪縛からは開放され、落ち着いて原因究明と、冗長構成へ戻す対応に専念することができるのではないでしょうか。
もちろん冗長構成に戻るまでは、単一障害点となり、更なる障害が発生した場合はシステム停止に直結する為、のんびり対応して良い訳ではないことは言うまでもありません。
まとめ
いかがでしたでしょうか?
これまでは、LifeKeeperを始めとする冗長構成システムを利用するかたのメリットが語られることは多かったと思いますが、運用する皆さまのメンタルに対しても導入するメリットがあることがお判りいただけたのではないでしょうか。
・利用者・・・使いたい時に使える
・会社 ・・・障害時の機会損失の極小化
・運用者・・・障害時の原因究明に専念することができる