REDIS?

REDIS?

REDIS는 REmote DIctionary System의 약자로 메모리 기반의 Key/Value Store이다.

성능은 memcached에 버금가면서 다양한 데이타 구조체를 지원함으로써 Message Queue, Shared memory, Remote Dictionary 용도로도 사용될 수 있다.


Key/Value Store

Redis는 기본적으로 Key/Value Store이다. 특정 키 값에 값을 저장하는 구조로 되어 있고 기본적인 PUT/GET Operation을 지원한다.

Key Value
‘key’ ‘value’

단, 이 모든 데이타는 메모리에 저장되고, 이로 인하여 매우 빠른 write/read 속도를 보장한다. 그래서 전체 저장 가능한 데이타 용량은 물리적인 메모리 크기를 넘어설 수 있다.


Data Type

Image_%5B7%5D.png

REDIS가 Key/Value Store이기는 하지만 저장되는 Value가 단순한 Object가 아니라 자료구조를 갖기 때문에 큰 차이를 보인다. 아래는 이러한 자료구조들의 특징이다.

  • Value가 일반적인 String 뿐만 아니라, set, list, hash와 같은 집합형 데이타 구조를 지원한다.
  • 저장된 데이타에 대한 연산이나 추가 작업 가능하다. (합집합,교집합,RANGE QUERY 등)
  • set은 일종의 집합, sorted set은 오름차순으로 정렬된 집합, hash는 키 기반의 테이블, list는 일종의 링크드 리스트 와 같은 특성을 지니고 있다.

REDIS가 지원하는 데이타 형은 크게 아래와 같이 5가지가 있다.


1. String
  • 일반적인 문자열로 최대 512mbyte 길이 까지 지원한다.
  • Text 문자열 뿐만 아니라 Integer와 같은 숫자나 JPEG같은 Binary File까지 저장할 수 있다.
  • 명령어 : http://redis.io/commands#string


2. Set

Image_%5B2%5D.png

  • set은 String의 집합이다. 여러개의 값을 하나의 Value 내에 넣을 수 있다고 생각하면 되며 블로그 포스트의 태깅(Tag)등에 사용될 수 있다
  • 명령어 : http://redis.io/commands#set


3. Sorted Set

Image_%5B3%5D.png

  • set 에 “score” 라는 필드가 추가된 데이타 형으로 score는 일종의 “가중치” 정도로 생각하면 된다.
  • 명령어 : http://redis.io/commands#sorted_set


4. Hashes

Image_%5B4%5D.png

  • hash는 value내에 field/string value 쌍으로 이루어진 테이블을 저장하는 데이타 구조체이다.
  • 명령어 : http://redis.io/commands#hash


5. List

Image_%5B5%5D.png

  • list는 string들의 집합으로 저장되는 데이타 형태는 set과 유사하지만, 일종의 양방향 Linked List라고 생각하면 된다.
  • List 앞과 뒤에서 PUSH/POP 연산을 이용해서 데이타를 넣거나 뺄 수 있고, 지정된 INDEX 값을 이용하여 지정된 위치에 데이타를 넣거나 뺄 수 있다.
  • 명령어 : http://redis.io/commands#list



Persistence

REDIS는 데이타를 disk에 저장할 수 있다.

memory cached의 경우 메모리에만 데이타를 저장하기 때문에 서버가 shutdown 된후에 데이타가 유실 되지만, REDIS는 서버가 shutdown된 후 restart되더라도, disk에 저장해놓은 데이타를 다시 읽어서 메모리에 Loading하기 때문에 데이타 유실되지 않는다.

REDIS에서는 데이타를 저장하는 방법이 snapshotting 방식과 AOF (Append on file) 두가지가 있다.


Snapshotting (RDB) 방식

Snapshotting 방식은 순간적으로 메모리에 있는 내용을 DISK에 전체를 옮겨 담는 방식이다.

SAVEBGSAVE 두가지 방식이 있는데, SAVE는 blocking 방식으로 순간적으로 REDIS의 모든 동작을 정지시키고, 그때의 snapshot을 disk에 저장한다.

BGSAVE는 non-blocking 방식으로 별도의 process를 띄운후, 명령어 수행 당시의 메모리 snaopshot을 disk에 저장하며, 저장 순간에 REDIS는 동작을 멈추지 않고 정상적으로 동작한다.

  • 장점 : 메모리의 snapshot을 그대로 뜬 것이기 때문에, 서버 restart시 snapshot만 load하면 되므로 restart 시간이 빠르다.
  • 단점 : snapshot을 추출하는데 시간이 오래 걸리며, snapshot 추출된후 서버가 down되면 snapshot 추출 이후 데이타는 유실된다. (백업 시점의 데이타만 유지된다는 이야기)


AOF(Append On File) 방식

AOF(Append On File) 방식은 REDIS의 모든 write/update 연산 자체를 모두 log 파일에 기록하는 형태이다.

서버가 재 시작될때 기록된 write/update operation을 순차적으로 재 실행하여 데이타를 복구한다.

operation 이 발생할때 마다 매번 기록하기 때문에, RDB 방식과는 달리 특정 시점이 아니라 항상 현재 시점까지의 로그를 기록할 수 있으며, 기본적으로 non-blocking call이다.

  • 장점 : Log file에 대해서 append만 하기 때문에, log write 속도가 빠르며, 어느 시점에 server가 down되더라도 데이타 유실이 발생하지 않는다.(최신의 상태를 유지)
  • 단점 : 모든 write/update operation에 대해서 log를 남기기 때문에 로그 데이타 양이 RDB 방식에 비해서 과대하게 크며, 복구시 저장된 write/update operation을 다시 replay 하기 때문에 restart속도가 느리다.

사용방식 RDBAOF, 두가지 방식을 혼용해서 사용하는 것이 바람직한데 주기적으로 snapshot으로 백업하고, 다음 snapshot까지의 저장을 AOF 방식으로 수행한다.

이렇게 하면 서버가 restart될 때 백업된 snapshot을 reload하고, 소량의 AOF 로그만 replay하면 되기 때문에, restart 시간을 절약하고 데이타의 유실을 방지할 수 있다.

참고 : http://redis.org/topics/persistence



Publish/Subscribe Model

REDIS는 JMS나 IBM MQ 같은 메세징에 활용할 수 있는데, 1:1 형태의 Queue 뿐만 아니라 1:N 형태의 Publish/Subscribe 메세징도 지원한다.(Publish/Subscribe 구조에서 사용되는 Queue를 일반적으로 Topic이라고 한다.)

하나의 Client가 메세지를 Publish하면, 이 Topic에 연결되어 있는 다수의 클라이언트가 메세지를 받을 수 있는 구조이다.

Image_%5B8%5D.png

일반적인 Pub/Sub 시스템의 경우 Subscribe 하는 하나의 Topic에서만 Subscribe하는데 반해서, redis에서는 pattern matching을 통해서 다수의 Topic에서 message 를 subscribe할 수 있다.

예를 들어 topic 이름이 music.pop, music.classic 이라는 두개의 Topic이 있을때, “PSUBSCRIBE music.*“라고 하면 두개의 Topic에서 동시에 message를 subscribe할 수 있다.



Replication Topology

REDIS는 NoSQL 계열의 Key/Store Storage인데 반해서 횡적 확장성을 지원하지 않는다.

쉽게 말해서 2.4.15 현재 버전 기준으로는 클러스터링 기능이 없다. (향후 지원 예정이라고 함)

그래서 확장성(scalability)과 성능에 제약사항이 있는데, 다행이도 Master/Slave 구조의 Replication(복제)를 지원하기 때문에 성능 부분에 있어서는 어느정도 커버가 가능하다.


Master/Slave replication

Master/Slave Replication이란, redis의 master node에 write된 내용을 복제를 통해서 slave node에 복제 하는 것을 정의한다.

1개의 master node는 n개의 slave node를 가질 수 있으며, 각 slave node도 그에 대한 slave node를 또 가질 수 있다.

Image_%5B9%5D.png

master/slave 간의 복제는 Non-blocking 상태로 이루어진다. 즉 master node에서 write나 query 연산을 하고 있을 때도 background로 slave node에 데이타를 복사하고 있다는 이야기고, 이는 master/slave node간의 데이타 불일치성을 유발할 수 있다는 이야기이기도 하다.

master node에 write한 데이타가 slave node에 복제중이라면 slave node에서 데이타를 조회할 경우 이전의 데이타가 조회될 수 있다.(non-blocking이기 때문에)


Query Off Loading을 통한 성능향상

그러면 이 master/slave replication을 통해서 무엇을 할 수 있냐?

성능을 높일 수 있다. (동시접속자수나 처리 속도를 늘릴 수 있으나 데이타 저장 용량은 늘릴 수 없다.) 이를 위해서 Query Off Loading이라는 기법을 사용하는데 Query Off Loading은 master node는 write only, slave node는 read only 로 사용하는 방법이다.

단지 redis에서만 사용하는 기법이 아니라, Oracle,MySQL과 같은 RDBMS에서도 많이 사용하는 아키텍쳐 패턴이다.

대부분의 DB 트렌젝션은 웹시스템의 경우 write10~20%, read70~90% 선이기 때문에, read 트렌젝션을 분산 시킨다면, 처리 시간과 속도를 비약적으로 증가 시킬 수 있다.

특히 REDIS의 경우 value에 대한 여러가지 연산(합집합,교집합,Range Query)등을 수행하기 때문에, 단순 PUT/GET만 하는 NoSQL이나 memcached에 비해서 read에 사용되는 resource의 양이 상대적으로 높기 때문에 REDIS의 성능을 높이기 위해서 효과적인 방법이다.


Sharding을 통한 용량확장

REDIS가 클러스터링을 통한 확장성을 제공하지 않는다면, 데이타의 용량이 늘어나면 어떤 방법으로 REDIS를 확장해야 할까?

일반적으로 Sharding이라는 아키텍쳐를 이용한다. Sharding은 Query Off loading과 마친가지로, REDIS 뿐만 아니라 일반적인 RDBMS나 다른 NoSQL에서도 많이 사용하는 아키텍쳐로 내용 자체는 간단하다.

Image_%5B10%5D.png

여러개의 REDIS 서버를 구성한 후에, 데이타를 일정 구역별로 나눠서 저장하는 것이다.

예를 들어 숫자를 key로 하는 데이타가 있을때 아래와 그림과 같이 REDIS 서버별로 저장하는 key 대역폭을 정해놓은 후에, 나눠서 저장한다. 데이타 분산에 대한 통제권은 client가 가지며 client에서 애플리케이션 로직으로 처리한다.



Expriation

REDIS는 데이타에 대해서 생명주기를 정해서 일정 시간이 지나면 자동으로 삭제되게 할 수 있다.

REDIS가 expire된 데이타를 삭제 하는 정책은 내부적으로 ActivePassive 두 가지 방법을 사용한다.

  • Active = Client가 expired된 데이타에 접근하려고 했을 때, 그때 체크해서 지우는 방법.
  • Passive = 주기적으로 key들을 random으로 100개만 (전부가 아니라) 스캔해서 지우는 방식.

Expired time이 지난 후 클라이언트에 의해서 접근 되지 않은 데이타는 Active 방식으로 인해서 지워지지 않고 Passive 방식으로 지워져야 한다.

그렇지만 이 경우 Passive 방식의 경우 전체 데이타를 scan하는 것이 아니기 때문에, REDIS에는 항상 expired 되었으나 지워지지 않는 garbage 데이타가 존재할 수 있는 원인이 된다.



REDIS INSTALL

https://github.com/rgl/redis/downloads 에서 최신 버전 다운로드 받은후, redis-server.exe를 실행

클라이언트는 redis-cli.exe를 실행

아래는 테스트 스크립트 이다.

1
2
3
4
5
6
7
8
9
10
11
12
13
% cd src
% ./redis-cli
redis> ping
PONG
redis> set foo bar
OK
redis> get foo
"bar"
redis> incr mycounter
(integer) 1
redis> incr mycounter
(integer) 2
redis> 

원본자료

조대협의 블로그 http://bcho.tistory.com/654