本サイトではより多くの方に快適に利用して頂ける様に、アクセシビリティ面を充分に考慮したコンテンツの提供を心がけております。その一環として、閲覧対象コンテンツのすべてにスタイルシートを使用して制作しております。現在閲覧に使用されているブラウザには、当方制作のスタイルシートが適用されておりませんので表示結果が異なりますが、情報そのものをご利用するにあたっては問題はございません。

RUNNET改善委員会

RUNNETのシステム障害に関するお詫びと今後の対策について

ここ最近の先着大会において発生しましたRUNNETのシステム障害について、その原因及び今後の対策に関し下記の通りご報告申し上げます。

この度の障害によって、人気先着大会の参加希望者をはじめ、多くの利用者の方々に多大なご迷惑、ご心配をおかけしましたことを、心よりお詫び申し上げます。翌日に出場レースがあった方、お仕事の方、充実した練習計画やその他の予定を立てられていた方、すべての皆さまにエントリーのための長時間拘束を強い、苛立ちや失望を与えてしまいました。大変申し訳ございませんでした。


弊社では近年の大会参加希望者増に対してシステム増強を日々行って参りましたが、最も大きい混乱を招きました6月1日のシステム障害や、最近の先着大会でのアクセス混雑に際しては、その対応では不十分という結果となりました。予測の甘さがあったことは明らかで申し開きの余地はございません。システム面、運営面、また大会主催者との申し込み日設定など、すべての準備で見込みの甘さがありました。
特に直近のシステム障害の内容につきまして、何が起きたのか、何が悪かったのか、下記にてご説明いたします。


また、今後同様の事態を発生させないために、主に以下の改善と補強の対策を実施いたします。

 ●回線の補強
 ●ルータ(上位機種)交換
 ●負荷分散装置のSSLアクセラレータのキャパシティ向上
 ●トラフィックの軽減

詳しいご説明を下記でいたしておりますが、これら回線とネットワーク機器を補強してシステム全体を安定させることにより、アクセスが集中した際も「200件/分」以上のエントリー処理ができるようになります(昨年度の約4倍の処理能力)。

皆さまからRUNNETへ、ならびに各大会事務局へお寄せいただいたご意見、ご批判、ご指摘のひとつひとつを弊社は重く受けとめ、不十分なサービス体制を猛省するとともに、皆さまのご期待に応えることができなかった事実を忘れることなく、真摯に見つめてまいります。
その上でRUNNETは「ランニングを愛好する人々に快適なインターネットサービスを提供する」という目的に立ち返り、全社一丸となって信頼回復に最大限の努力と体制を敷く所存です。

最後に、障害の原因を特定していながらこのご報告をすぐにお知らせできず、重ね重ね申し訳ございませんでした。今後の具体的な対策構築をお約束したいばかりに、お時間を頂戴してしまいました。弊社の力不足と配慮不足をお詫び申し上げます。

皆さまには、お詫びの気持ち同様に、深く感謝しております。
何卒ご理解の程よろしくお願い申し上げます。

2013年6月14日
株式会社アールビーズ

6/1システム障害に関するご報告

今後のアクセス集中対策について

6/1システム障害に関するご報告

【障害原因】

【1】インターネット回線のひっ迫
エントリー開始1時間前よりアクセスが殺到(スパイク)したことによりインターネット回線がひっ迫し、通信が不安定な状態となりました。

【2】ルータの故障
【1】の影響によりルータに異常をきたしました。ただし早期に対処(交換)したため、ルータの故障は今回の障害の主たる要因にはなっていません。

【3】負荷分散装置のキャパシティ不足について
個人情報の暗号化・複合化処理を、負荷分散装置(ロードバランサー)のSSLアクセラレータによって行っておりますが、その負荷分散装置の処理能力を超えたアクセスにより装置が正しく作動せず、エントリー画面まで到達しながら途中で通信が落ちてしまうという状況を招きました(https通信が不安定になりました)。

※「順番待ちシステム」の変更
2013年3月に順番待ちシステムを変更し、エントリーの処理速度が3~5倍に改善されましたが、この変更が結果的にネットワーク機器への負荷増大に影響していることが判明いたしました。通常規模のエントリーであれば耐えうる追加の負荷でしたが、超人気大会の募集開始時に想定を超えるアクセスが殺到し、【1】~【3】の事象を発生させる要因となってしまいました。

原因

障害発生経緯

湘南国際マラソンのエントリー開始直前より上記【1】が発生、「順番待ちの時間表示をとりやめることでシステムへのストレスを軽減する」など施しましたが、その後1時間ごとに【2】【3】と続けて発生いたしました。この間、現場対応としては「待ち人数カウント間隔を10秒→30秒へ変更」「スムーズにエントリー画面まで到達していただくために、混雑画面の挿入箇所を5箇所→3箇所へ変更」も本番中に実施いたしましたが、高負荷状態を落ち着かせ障害解消となるには大変時間がかかりました。

事前の負荷対策について

ウエブサーバー、AP サーバー、DB サーバーの増強をおよそ1年かけて実施し、エントリー処理がこれまでの約4倍の速度で進められるサーバー構成に増強いたしました。しかしながら、ピーク時のスパイク値に対するインターネット回線の不足と、ネットワーク機器へのトラフィック量増加に対する手立てが不十分だったため、サーバーの処理能力を活かすことができませんでした。

事前の負荷対策



今後のアクセス集中対策について (システム強化策)

6月25日までに、主に以下1~4の対策を実施いたします。
回線・ネットワーク機器を補強し、システム全体を安定させることにより、アクセスが集中した際でも「200件/分」以上のエントリー処理を実行できるよういたします(昨年の約4倍の処理能力)。

1. 回線を補強いたします

これまで2回線で運用してきましたが、アクセス集中によるスパイク対策として新たに2回線追加いたします(合計4回線)。これにより、回線強度は約5倍となります。
詳細図はこちら

2.ルータを上位機種に交換いたします

より高性能なルータに交換し、回線ダウンを防ぎます(性能は既存の約4倍)。
詳細図はこちら

3.SSLアクセラレータを交換し、最大接続数を適正値に調整いたします

より高性能なSSLアクセラレータに交換し、暗号化処理のキャパシティを向上させます。同時に、負荷分散装置へのアクセス量を適正に保つサーバー設定を再調整いたします。
詳細図はこちら

4. 混雑画面を軽量化しトラフィックを減らします

待ち時間を少しでも短くするため、混雑画面(混雑画面のファイル)の情報量を軽量化し、混雑画面表示のネットワーク全体に対するトラフィックを1/4に軽減いたします。
詳細図はこちら
※トラフィック※
ネットワーク上を移動する文章や画像などのデジタルデータおよびデジタル情報量をトラフィックといいます。トラフィックを減らすことで、通信の負荷を下げることができます。

対策4-2_混雑画面軽量化

上記に関するお問い合わせ窓口

本件に関するお問い合わせは下記へお寄せください。
(株)アールビーズRUNTESコールセンター
問い合わせフォーム

RUNNETにおける今後の「大会エントリー」について

今月末の混雑予想日より、上記のような体制をとってまいります。
そして、このたびの件をきっかけに、RUNNETではこれからの「大会エントリー」について、いま一度根本から考えてまいります。複数の大会で散見される混乱や課題、なにが“公平”なのか、アクセス集中をかいくぐる術を身につけないとならないのか、運を天にまかせるのか、大会に出たいという“熱意の強さ”は練習量を抜きで語られるものなのか、等々。ランナーの皆さまの声にも耳を傾け、多くの問題についてとことん考え、“RUNNETの提案”を持ちたいと思っております。むろん、それを展開できるシステム構築や仕組みづくりを実装していきます。

当「RUNNET改善委員会」では、継続して「大会エントリー」問題を取り上げ、折にふれ皆さまにご意見を求めることや、何某かのご説明の機会を持っていく所存です。ランナーの皆さまのご期待に添えるサービスの提供を目的に、よりよいコミュニケーションを持つことに誠心誠意努めてまいります。

ご意見ご要望はこちらから


(2013年06月14日)

ご意見対象 : 大会エントリー

  • 利便性UP
  • わかりやすさUP
  • お客様サポート
  • 安全性UP

一覧に戻る

ランニング初心者集まれ