MailHosting - 東京大学情報基盤センター 学内組織向けメールサーバ環境 - | Top > 広報 > 障害情報

5月19, 20日のMailHostingサービスおよび ECCS教職員メールサービスの障害について

障害情報

作成: 2018年05月23日

5月19日(土) 9:00頃から始めたファイルサーバのメンテナンス作業終了後、事前に予告した13:00になってもMailHostingサービスおよび教育用計算機システム(ECCS)教職員メールサービスを再開できず、5月20日(日)17:00頃まで、利用者の皆様へのメールの配送が停止致しました。メール配送に大きな遅延が生じ、利用者の皆様には大変なご迷惑をおかけいたしましたことを、お詫び申し上げます。

障害の原因

5月19日(土)に行なったメンテナンス作業では、MailHostingサービスおよびECCSの各種サービスで共用しているファイルサーバのOS(DELL EMC社のOneFS)を、サポート期間終了が間近に迫ったバージョンから、新しいバージョンにバージョンアップしました。その結果、メールサーバが利用しているNFSのファイルロック機能が正常に動作しなくなりました。これが今回の障害の直接の原因です。

問題の切り分けと管理者用マニュアルにも載っていない対処方法を見つけ出すために時間を要し、長時間の停止に至りました。

今後の対応方針

機能維持やセキュリティ対策等のために、ソフトウェアのバージョンアップを行うことは避けられません。また、ソフトウェアのバージョンアップに伴う不整合を完全に無くすことも困難です。しかし、障害発生の確率を減らすことはできますので、(1) 事前準備(作業内容のレビュー、テスト環境での動作確認など)と(2)バックアッププラン(作業が失敗したときの代替プランや被害を軽減するプラン)の策定を、今まで以上に強化します。

参考情報

メールサービスの障害による停止に備え、利用者が取れる対策としては、複数の独立したメールサービスを併用する方法が一般的です。特に、メールサービスの停止による被害が大きい場合に有効です。なお、情報基盤センターでは、今回障害を起こしたMailHostingサービスおよびECCS教職員メールサービスの他に、Google社G Suite (Gmail)を利用したECCSクラウドメールサービスも提供しています。