フェイルソフトとは?
フェイルソフト (fail soft) とは、システムの障害が発生した場合でも、システム全体が動作し続けながら、障害に関わるサブシステムのみが停止する仕組みを指します。つまり、システム全体がクラッシュすることを防ぐことができるため、高可用性のシステムを実現することができます。
この仕組みは、航空機の制御システムや銀行のシステムなど、実に様々な分野で利用されています。
フェイルソフトの基本概念
フェイルソフトの基本概念には、以下の3つがあります。
1. エラーを検知する仕組み
フェイルソフトシステムは、システムにエラーがあることを検知するための多くの仕組みを持っています。例えば、多重化された同一のシステムや監視システムによって、エラーを検知することができます。
2. リカバリー機能
フェイルソフトシステムは、エラーが発生すると、サブシステムの代わりにバックアップシステムを起動し、システム全体が停止することを防ぎます。このバックアップシステムは、障害が発生したサブシステムが復旧するまで、代わりに機能することができます。
3. 障害解決手順の策定
フェイルソフトシステムでは、障害が発生した場合に備えて、事前に障害解決手順を策定し、復旧を迅速かつ正確に行うことが必要です。また、システム障害が発生した場合には、障害が発生した原因を特定し、再発防止策を策定することも重要です。
まとめ
フェイルソフトは、システム障害時にもシステム全体が動作し続けることができるため、高可用性のシステムを実現することができます。フェイルソフトシステムを導入する場合は、エラー検知、リカバリー機能、障害解決手順の策定を念入りに行うことが必要です。