Redis Sentinelを運用してみたお話

Redis

2013/4/24

こんにちは、宇津井です。

弊社ではゲソてんというゲームプラットフォームを運営しております。ゲソてんではサービスリリース当初から主にキャッシュ的な役割でRedisを導入していました。つい先日の事ですが訳あってRedis 2.6からサポートされたRedis Sentinelを採用しました。今回は、採用に至った経緯をご紹介します。

簡単なシステム構成

パフォーマンスは良いし、Memcachedには無い便利な機能を提供するRedisですが約一年間運用していくつかの問題が出てきました。

Redisサーバーが突然高負荷に陥る
するとWebサーバーも高負荷に陥る
RedisのReplicationは張ってるけどアプリケーション側でRedis Slaveへフェイルオーバーしない（MySQLを直接参照する）
Redis落ちると恐らくMySQLサーバーが耐えられない（落ちた事無いけど）

という事で対策を行ってきました。

まずは1,2番の問題です。WebサーバーとRedisサーバーの荒ぶりはRedisサーバーのUpgradeで事なきを得ました。当時のRedis Versionは2.4.15です。ReleaseNotes(2.4,2.6)を拝見すると色々あります。というか2.6が出てます。ReleaseNotesをきちんと確認してきちんとUpgradeしていきましょう。

検証して問題なかったのでさっさと2.6系にUpgradeし、一旦高負荷問題は落ち着きました。この際に色々とチューニングを施しましたがRedisは元々高速で面白みに欠けます。（後で解ったことですがF5アタックも受けてました。これは別途Nginxで対処してます）

尚、2.4系から2.6系はRedisの使われ方にも依りますが比較的すんなりUpgrade出来ます。今回行った手順はざっくり以下のような感じです。

1. Slaveは現状アプリから使ってないのでslaveを2.6にUpgradeしておく

2. アプリをSlave側に向ける

3. Slaveはslave_read_only:0にしておく（書込可能）

4. Masterにアクセスがない事を確認したらSlaveをMaster昇格

(redis-02) slaveof no one

5. Masterをシャットダウン

(redis-01) superviserctl stop redis

6. 旧Master(redis-01)のRedisを2.6にUpgrade & 旧Master(redis-01)のRedisを起動

7. 旧Master(redis-01)を新Master(redis-02)のSlaveに設定

(redis-01) slaveof redis-02 6379

8. Slaveは書込可能にしておく

(redis-01) slave_read_only:0

　※この後に出てくるSentinelに対応するためreadonlyを解除してしまいます

さて、高負荷問題が落ち着きRedisは安定している。もう対策しなくていいんじゃね？という空気が漂う中DBAの田中さんが「いやいや、フェイルオーバーまでしないとダメでしょ！落ちたらどーすんの？」とケツを叩いてくれます。

やっぱりSentinelの対応することになりました。Sentinelですが簡単に説明すると以下のような感じです。

MasterとSlaveの状態を監視
何か起きたら通知
何か起きたら自動フェイルオーバー

詳しくはドキュメントを読みましょう。（英語です）

加えて以下の特徴を持ちます。

一つのMasterに対して複数のSentinelプロセスを起動してお互いにMasterの情報を共有し合う
Masterのダウンは複数個のSentinelプロセスが投票方式で検知する例：Sentinelを4プロセス立ち上げた場合、3個以上がダウン(SDOWN)と判定したらMasterダウン(ODOWN)と見なしフェイルオーバーする。※Masterダウン(ODOWN)を判定する条件は指定できます。
夢のようなクラスター機能ではない
通常はNoPreempt(フェイルバック機能は持たない)
VIP、或はプロキシ的な機能は持たない

最後に「VIP、あるいはプロキシ的な機能は持たない」と書きましたがこれが面倒な点です。障害時にSlaveのMaster昇格は行ってくれますが、アプリケーションからの接続はRedis, Redis Sentinel以外の何かしらで制御する必要があります。

ということでアプリケーション側できちんとMater/Slave状態を追いかけるにはどうするのか考えました。（自社データセンター内ですのであまり制約がありません）

1. Load Balancer方式