为什么要用 Nosql
1、单机 MySQL 的年代!
90 年代,一个基本的网站访问量一般不会太大,单个数据库完全足够!
那个时候,更多的去使用静态网页 HTML ==> 服务器根本没有太大的压力!
思考一下,这种情况下:整个网站的瓶颈是什么?
数据量如果太大,一个机器放不下了!
数据的索引( B + Tree),一个机器内存也放不下
访问量(读写混合),一个服务器承受不了
只要你开始出现以上的三种情况之一,那么你就必须晋级!
2、Memcached(缓存)+ MySQL + 垂直拆分(读写分离)
网站 80%的情况都是在读,每次都要去查询数据库的话就十分的麻烦!所以说我们希望减轻数据库的压力,我们可以使用缓存来保证效率!
发展过程:优化数据结构和索引 –> 文件缓存(IO)–> Memcached(当时最热门的技术!)
3、分库分表 + 水平拆分 + MySQL 集群
技术和业务在发展的同时,对人的要求也越来越高!
==本质:数据库(读、写)==
早些年 MyISAM:表锁,十分影响效率!高并发下就会出现严重的锁问题
转战 Innodb:行锁
慢慢的就开始使用分库分表来解决写的压力!MySQL 在那个年代就推出了 表分区!这个并没有多少公司使用!
MySQL 的集群,很好的满足那个年代的需求!
4、最近的年代
如今信息量井喷式增长,各种各样的数据出现(用户定位数据,图片数据等),大数据的背景下关系型数据库(RDBMS)无法满足大量数据要求。Nosql 数据库就能轻松解决这些问题。目前一个基本的互联网项目:
为什么要用 NoSQL!
用户的个人信息,社交网络,地理位置。用户自己产生的数据,用户日志等等爆发式增长!这时候我们就需要使用 NoSQL 数据库的,Nosql 可以很好的处理以上的情况!
什么是 NoSQL
NoSQL
NoSQL = Not Only SQL(不仅仅是 SQL)
Not Only Structured Query Language
关系型数据库:列+行,同一个表下数据的结构是一样的。
非关系型数据库:数据存储没有固定的格式,并且可以进行横向扩展。
NoSQL 泛指非关系型数据库,随着 web2.0 互联网的诞生,传统的关系型数据库很难对付 web2.0 时代!尤其是超大规模的高并发的社区,暴露出来很多难以克服的问题,NoSQL 在当今大数据环境下发展的十分迅速,Redis 是发展最快的。
NoSQL 特点
方便扩展(数据之间没有关系,很好扩展!)
大数据量高性能(Redis 一秒可以写 8 万次,读 11 万次,NoSQL 的缓存记录级,是一种细粒度的缓存,性能会比较高!)
数据类型是多样型的!(不需要事先设计数据库,随取随用)
传统的 RDBMS 和 NoSQL
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ASCIIDOC 传统的 RDBMS - 结构化组织 - SQL - 数据和关系都存在单独的表中 row col - 操作,数据定义语言 - 严格的一致性 - 严格的事务 - ... ASCIIDOC NoSQL - 不仅仅是数据 - 没有固定的查询语言 - 键值对存储,列存储,文档存储,图形数据库(社交关系) - 最终一致性 - CAP定理和BASE - 高性能,高可用,高可扩 - ...
了解:3V+3 高
大数据时代的 3V :主要是描述问题的
海量 Velume
多样 Variety
实时 Velocity
大数据时代的 3 高 : 主要是对程序的要求
真正在公司中的实践:NoSQL + RDBMS 一起使用才是最强的。
NoSQL 的四大分类 KV 键值对
新浪:Redis
美团:Redis + Tair
阿里、百度:Redis + memecache
文档型数据库(bson 格式 和 json 一样)
mongoDB
MongoDB 是一个基于分布式文件存储的数据库,C++编写,主要用来处理大量的文档!
MongoDB 是一个介于关系型数据库和非关系型数据库中间的产品!MongoDB 是非关系型数据库汇总功能最丰富的,最像关系型数据库的!
CouchDB
列存储数据库
图关系数据库
他不是存图形,放的是关系,比如:朋友圈社交网络,广告推荐!
Neo4j ,infoGrid
Redis 入门 概述
Redis 是什么?
Redis(Remote Dictionary Server ),即远程字典服务。
是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。
与 memcached 一样,为了保证效率,数据都是缓存在内存中。区别的是 redis 会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了 master-slave(主从)同步。
Redis 能干嘛?
内存存储、持久化,内存中是断电即失、所以说持久化很重要(RDB、AOF)
效率高,可以用于高速缓存
发布订阅系统
地图信息分析
计时器、计数器(浏览量!)
……
特性
多样的数据类型
持久化
集群
事务
…
环境搭建(省略) Redis 安装 | 菜鸟教程 (runoob.com)
测试性能 redis-benchmark 是一个压力测试工具!
官方自带的性能测试工具!
1 2 BASH redis-benchmark [option] [option value]
我们来简单测试一下:
1 2 3 BASH # 测试100个并发连接 100000个请求 redis-benchmark localhost -p 6379 -c 100 -n 100000
如何查看这些分析呢?
基础的知识 redis 默认有 16 个数据库
默认使用的是第 0 个
可以使用select
进行切换数据库!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 BASH 127.0.0.1:6379> select 3 #切换数据库 OK 127.0.0.1:6379[3]> DBSIZE #查看db大小 (integer) 0 127.0.0.1:6379[3]> set name ouwen #设置key-value OK 127.0.0.1:6379[3]> DBSIZE #查看db大小 (integer) 1 127.0.0.1:6379[3]> get name #获取value "ouwen" 127.0.0.1:6379[3]> keys * #获取所有key 1) "name" 127.0.0.1:6379[3]> FLUSHDB #清除当前数据库 OK 127.0.0.1:6379[3]> keys * (empty list or set) 127.0.0.1:6379[3]> FLUSHALL #清除全部数据库 OK
Redis 是单线程的!
Redis 到底有多快?
Redis 采用的是基于内存的采用的是单进程单线程 模型的 KV 数据库 ,由 C 语言编写 ,官方提供的数据是可以达到 100000+的 QPS(每秒内查询次数)。这个数据不比采用单进程多线程的同样基于内存的 KV 数据库 Memcached 差!
Redis 为什么这么快?
完全基于内存,绝大部分请求是纯粹的内存操作,非常快速。数据存在内存中,类似于 HashMap,HashMap 的优势就是查找和操作的时间复杂度都是 O(1);
数据结构简单,对数据操作也简单,Redis 中的数据结构是专门进行设计的;
采用单线程,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗 CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导致的性能消耗;
使用多路 I/O 复用模型,非阻塞 IO;
使用底层模型不同,它们之间底层实现方式以及与客户端之间通信的应用协议不一样,Redis 直接自己构建了 VM 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求;
以上几点都比较好理解,下边我们针对多路 I/O 复用模型进行简单的探讨:
多路 I/O 复用模型
多路 I/O 复用模型是利用 select、poll、epoll 可以同时监察多个流的 I/O 事件的能力,在空闲的时候,会把当前线程阻塞掉,当有一个或多个流有 I/O 事件时,就从阻塞态中唤醒,于是程序就会轮询一遍所有的流(epoll 是只轮询那些真正发出了事件的流),并且只依次顺序的处理就绪的流,这种做法就避免了大量的无用操作。
这里“多路”指的是多个网络连接,“复用”指的是复用同一个线程。 采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络 IO 的时间消耗),且 Redis 在内存中操作数据的速度非常快,也就是说内存内的操作不会成为影响 Redis 性能的瓶颈,主要由以上几点造就了 Redis 具有很高的吞吐量。
那么为什么 Redis 是单线程的?
我们首先要明白,上边的种种分析,都是为了营造一个 Redis 很快的氛围!官方 FAQ 表示,因为 Redis 是基于内存的操作,CPU 不是 Redis 的瓶颈,Redis 的瓶颈最有可能是机器内存的大小或者网络带宽。既然单线程容易实现,而且 CPU 不会成为瓶颈,那就顺理成章地采用单线程的方案了(毕竟采用多线程会有很多麻烦!)。
五大数据类型
官方文档
Redis 是一个开源(BSD 许可)的,内存中的数据结构存储系统,它可以用作==数据库、缓存和消息中间 件 MQ==。 它支持多种类型的数据结构,如 字符串(strings), 散列(hashes), 列表(lists), 集合 (sets), 有序集合(sorted sets) 与范围查询, bitmaps, hyperloglogs 和 地理空间 (geospatial) 索引半径查询。 Redis 内置了 复制(replication),LUA 脚本(Lua scripting), LRU 驱动事件(LRU eviction),事务(transactions) 和不同级别的 磁盘持久化(persistence), 并通过 Redis 哨兵(Sentinel)和自动 分区(Cluster)提供高可用性(high availability)。
Redis-Key
String(字符串)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 BASH ########################################################################## 127.0.0.1:6379> set key1 v1 # 设置值 OK 127.0.0.1:6379> get key1 # 获得值 "v1" 127.0.0.1:6379> keys * # 获得所有的key 1) "key1" 127.0.0.1:6379> EXISTS key1 # 判断某一个key是否存在 (integer) 1 127.0.0.1:6379> APPEND key1 "hello" # 追加字符串,如果当前key不存在,就相当于setkey (integer) 7 127.0.0.1:6379> get key1 "v1hello" 127.0.0.1:6379> STRLEN key1 # 获取字符串的长度! (integer) 7 127.0.0.1:6379> APPEND key1 ",kaungshen" (integer) 17 127.0.0.1:6379> STRLEN key1 (integer) 17 127.0.0.1:6379> get key1 "v1hello,kaungshen" ########################################################################## # i++ # 步长 i+= 127.0.0.1:6379> set views 0 # 初始浏览量为0 OK 127.0.0.1:6379> get views "0" 127.0.0.1:6379> incr views # 自增1 浏览量变为1 (integer) 1 127.0.0.1:6379> incr views (integer) 2 127.0.0.1:6379> get views "2" 127.0.0.1:6379> decr views # 自减1 浏览量-1 (integer) 1 127.0.0.1:6379> decr views (integer) 0 127.0.0.1:6379> decr views (integer) -1 127.0.0.1:6379> get views "-1" 127.0.0.1:6379> INCRBY views 10 # 可以设置步长,指定增量! (integer) 9 127.0.0.1:6379> INCRBY views 10 (integer) 19 127.0.0.1:6379> DECRBY views 5 bilibili:狂神说Java(integer) 14 ########################################################################## # 字符串范围 range 127.0.0.1:6379> set key1 "hello,kuangshen" # 设置 key1 的值 OK 127.0.0.1:6379> get key1 "hello,kuangshen" 127.0.0.1:6379> GETRANGE key1 0 3 # 截取字符串 [0,3] "hell" 127.0.0.1:6379> GETRANGE key1 0 -1 # 获取全部的字符串 和 get key是一样的 "hello,kuangshen" # 替换! 127.0.0.1:6379> set key2 abcdefg OK 127.0.0.1:6379> get key2 "abcdefg" 127.0.0.1:6379> SETRANGE key2 1 xx # 替换指定位置开始的字符串! (integer) 7 127.0.0.1:6379> get key2 "axxdefg" ########################################################################## # setex (set with expire) # 设置过期时间 # setnx (set if not exist) # 不存在在设置 (在分布式锁中会常常使用!) 127.0.0.1:6379> setex key3 30 "hello" # 设置key3 的值为 hello,30秒后过期 OK 127.0.0.1:6379> ttl key3 (integer) 26 127.0.0.1:6379> get key3 "hello" 127.0.0.1:6379> setnx mykey "redis" # 如果mykey 不存在,创建mykey (integer) 1 127.0.0.1:6379> keys * 1) "key2" 2) "mykey" 3) "key1" 127.0.0.1:6379> ttl key3 (integer) -2 127.0.0.1:6379> setnx mykey "MongoDB" # 如果mykey存在,创建失败! (integer) 0 127.0.0.1:6379> get mykey "redis" ########################################################################## mset mget 127.0.0.1:6379> mset k1 v1 k2 v2 k3 v3 # 同时设置多个值 OK 127.0.0.1:6379> keys * 1) "k1" 2) "k2" 3) "k3" 127.0.0.1:6379> mget k1 k2 k3 # 同时获取多个值 1) "v1" 2) "v2" 3) "v3" bilibili:狂神说Java数据结构是相同的! String类似的使用场景:value除了是我们的字符串还可以是我们的数字! 计数器 统计多单位的数量 粉丝数 对象缓存存储! List(列表) 基本的数据类型,列表 127.0.0.1:6379> msetnx k1 v1 k4 v4 # msetnx 是一个原子性的操作,要么一起成功,要么一起 失败! (integer) 0 127.0.0.1:6379> get k4 (nil) # 对象 set user:1 {name:zhangsan,age:3} # 设置一个user:1 对象 值为 json字符来保存一个对象! # 这里的key是一个巧妙的设计: user:{id}:{filed} , 如此设计在Redis中是完全OK了! 127.0.0.1:6379> mset user:1:name zhangsan user:1:age 2 OK 127.0.0.1:6379> mget user:1:name user:1:age 1) "zhangsan" 2) "2" ########################################################################## getset # 先get然后在set 127.0.0.1:6379> getset db redis # 如果不存在值,则返回 nil (nil) 127.0.0.1:6379> get db "redis 127.0.0.1:6379> getset db mongodb # 如果存在值,获取原来的值,并设置新的值 "redis" 127.0.0.1:6379> get db "mongodb"
数据结构是相同的!
String 类似的使用场景:value 除了是我们的字符串还可以是我们的数字!
List(列表) Redis 列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)
一个列表最多可以包含 232 - 1 个元素 (4294967295, 每个列表超过 40 亿个元素)。
基本的数据类型,列表
在 redis 里面,我们可以把 list 玩成 ,栈、队列、阻塞队列!
所有的 list 命令都是用 l 开头的,Redis 不区分大小命令
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 BASH ########################################################################## 127.0.0.1:6379> LPUSH list one # 将一个值或者多个值,插入到列表头部 (左) (integer) 1 127.0.0.1:6379> LPUSH list two (integer) 2 127.0.0.1:6379> LPUSH list three (integer) 3 127.0.0.1:6379> LRANGE list 0 -1 # 获取list中值! 1) "three" 2) "two" 3) "one" 127.0.0.1:6379> LRANGE list 0 1 # 通过区间获取具体的值! 1) "three" 2) "two" 127.0.0.1:6379> Rpush list righr # 将一个值或者多个值,插入到列表位部 (右) (integer) 4 127.0.0.1:6379> LRANGE list 0 -1 1) "three" 2) "two" 3) "one" 4) "righr" ########################################################################## LPOP RPOP 127.0.0.1:6379> LRANGE list 0 -1 1) "three" 2) "two" 3) "one" 4) "righr" 127.0.0.1:6379> Lpop list # 移除list的第一个元素 "three" 127.0.0.1:6379> Rpop list # 移除list的最后一个元素 "righr" 127.0.0.1:6379> LRANGE list 0 -1 1) "two" 2) "one" ########################################################################## Lindex 127.0.0.1:6379> LRANGE list 0 -1 1) "two" 2) "one" 127.0.0.1:6379> lindex list 1 # 通过下标获得 list 中的某一个值! "one" 127.0.0.1:6379> lindex list 0 "two" ########################################################################## Llen 127.0.0.1:6379> Lpush list one (integer) 1 127.0.0.1:6379> Lpush list two bilibili:狂神说Java(integer) 2 127.0.0.1:6379> Lpush list three (integer) 3 127.0.0.1:6379> Llen list # 返回列表的长度 (integer) 3 ########################################################################## 移除指定的值! 取关 uid Lrem 127.0.0.1:6379> LRANGE list 0 -1 1) "three" 2) "three" 3) "two" 4) "one" 127.0.0.1:6379> lrem list 1 one # 移除list集合中指定个数的value,精确匹配 (integer) 1 127.0.0.1:6379> LRANGE list 0 -1 1) "three" 2) "three" 3) "two" 127.0.0.1:6379> lrem list 1 three (integer) 1 127.0.0.1:6379> LRANGE list 0 -1 1) "three" 2) "two" 127.0.0.1:6379> Lpush list three (integer) 3 127.0.0.1:6379> lrem list 2 three (integer) 2 127.0.0.1:6379> LRANGE list 0 -1 1) "two" ########################################################################## trim 修剪。; list 截断! 127.0.0.1:6379> keys * (empty list or set) 127.0.0.1:6379> Rpush mylist "hello" (integer) 1 127.0.0.1:6379> Rpush mylist "hello1" (integer) 2 127.0.0.1:6379> Rpush mylist "hello2" (integer) 3 127.0.0.1:6379> Rpush mylist "hello3" (integer) 4 127.0.0.1:6379> ltrim mylist 1 2 # 通过下标截取指定的长度,这个list已经被改变了,截断了 只剩下截取的元素! OK 127.0.0.1:6379> LRANGE mylist 0 -1 1) "hello1" 2) "hello2" ########################################################################## rpoplpush # 移除列表的最后一个元素,将他移动到新的列表中! 127.0.0.1:6379> rpush mylist "hello" bilibili:狂神说Java小结 他实际上是一个链表,before Node after , left,right 都可以插入值 如果key 不存在,创建新的链表 如果key存在,新增内容 (integer) 1 127.0.0.1:6379> rpush mylist "hello1" (integer) 2 127.0.0.1:6379> rpush mylist "hello2" (integer) 3 127.0.0.1:6379> rpoplpush mylist myotherlist # 移除列表的最后一个元素,将他移动到新的 列表中! "hello2" 127.0.0.1:6379> lrange mylist 0 -1 # 查看原来的列表 1) "hello" 2) "hello1" 127.0.0.1:6379> lrange myotherlist 0 -1 # 查看目标列表中,确实存在改值! 1) "hello2" ########################################################################## lset 将列表中指定下标的值替换为另外一个值,更新操作 127.0.0.1:6379> EXISTS list # 判断这个列表是否存在 (integer) 0 127.0.0.1:6379> lset list 0 item # 如果不存在列表我们去更新就会报错 (error) ERR no such key 127.0.0.1:6379> lpush list value1 (integer) 1 127.0.0.1:6379> LRANGE list 0 0 1) "value1" 127.0.0.1:6379> lset list 0 item # 如果存在,更新当前下标的值 OK 127.0.0.1:6379> LRANGE list 0 0 1) "item" 127.0.0.1:6379> lset list 1 other # 如果不存在,则会报错! (error) ERR index out of range ########################################################################## linsert # 将某个具体的value插入到列把你中某个元素的前面或者后面! 127.0.0.1:6379> Rpush mylist "hello" (integer) 1 127.0.0.1:6379> Rpush mylist "world" (integer) 2 127.0.0.1:6379> LINSERT mylist before "world" "other" (integer) 3 127.0.0.1:6379> LRANGE mylist 0 -1 1) "hello" 2) "other" 3) "world" 127.0.0.1:6379> LINSERT mylist after world new (integer) 4 127.0.0.1:6379> LRANGE mylist 0 -1 1) "hello" 2) "other" 3) "world" 4) "new"
小结
它实际上是一个链表,before Node after ,left right 都可以插入值
如果 key 不存在,创建新的链表
如果 key 存在,新增内容
如果移除了所有值,空链表,也代表不存在!
在两边插入或者改动值,效率最高!中间元素,相对来说效率会低一点~
消息排队!消息队列(LPUSH RPOP),栈(LPUSH LPOP)
Set(集合) set 中的值是不能重复的!
Redis 的 Set 是 String 类型的无序集合。集合成员是唯一的,这就意味着集合中不能出现重复的数据。
Redis 中集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是 O(1)。
集合中最大的成员数为 232 - 1 (4294967295, 每个集合可存储 40 多亿个成员)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 BASH ########################################################################## 127.0.0.1:6379> sadd myset "hello" # set集合中添加匀速 (integer) 1 127.0.0.1:6379> sadd myset "kuangshen" (integer) 1 127.0.0.1:6379> sadd myset "lovekuangshen" (integer) 1 127.0.0.1:6379> SMEMBERS myset # 查看指定set的所有值 1) "hello" 2) "lovekuangshen" 3) "kuangshen" 127.0.0.1:6379> SISMEMBER myset hello # 判断某一个值是不是在set集合中! (integer) 1 127.0.0.1:6379> SISMEMBER myset world (integer) 0 ########################################################################## 127.0.0.1:6379> scard myset # 获取set集合中的内容元素个数! (integer) 4 ########################################################################## rem 127.0.0.1:6379> srem myset hello # 移除set集合中的指定元素 (integer) 1 127.0.0.1:6379> scard myset (integer) 3 127.0.0.1:6379> SMEMBERS myset 1) "lovekuangshen2" 2) "lovekuangshen" 3) "kuangshen" ########################################################################## set 无序不重复集合。抽随机! 127.0.0.1:6379> SMEMBERS myset 1) "lovekuangshen2" 2) "lovekuangshen" 3) "kuangshen" 127.0.0.1:6379> SRANDMEMBER myset # 随机抽选出一个元素 "kuangshen" 127.0.0.1:6379> SRANDMEMBER myset "kuangshen" 127.0.0.1:6379> SRANDMEMBER myset "kuangshen" 127.0.0.1:6379> SRANDMEMBER myset "kuangshen" 127.0.0.1:6379> SRANDMEMBER myset 2 # 随机抽选出指定个数的元素 bilibili:狂神说Java1) "lovekuangshen" 2) "lovekuangshen2" 127.0.0.1:6379> SRANDMEMBER myset 2 1) "lovekuangshen" 2) "lovekuangshen2" 127.0.0.1:6379> SRANDMEMBER myset # 随机抽选出一个元素 "lovekuangshen2" ########################################################################## 删除定的key,随机删除key! 127.0.0.1:6379> SMEMBERS myset 1) "lovekuangshen2" 2) "lovekuangshen" 3) "kuangshen" 127.0.0.1:6379> spop myset # 随机删除一些set集合中的元素! "lovekuangshen2" 127.0.0.1:6379> spop myset "lovekuangshen" 127.0.0.1:6379> SMEMBERS myset 1) "kuangshen" ########################################################################## 将一个指定的值,移动到另外一个set集合! 127.0.0.1:6379> sadd myset "hello" (integer) 1 127.0.0.1:6379> sadd myset "world" (integer) 1 127.0.0.1:6379> sadd myset "kuangshen" (integer) 1 127.0.0.1:6379> sadd myset2 "set2" (integer) 1 127.0.0.1:6379> smove myset myset2 "kuangshen" # 将一个指定的值,移动到另外一个set集 合! (integer) 1 127.0.0.1:6379> SMEMBERS myset 1) "world" 2) "hello" 127.0.0.1:6379> SMEMBERS myset2 1) "kuangshen" 2) "set2" ########################################################################## 微博,B站,共同关注!(并集) 数字集合类: - 差集 SDIFF - 交集 - 并集 127.0.0.1:6379> SDIFF key1 key2 # 差集 1) "b" 2) "a" 127.0.0.1:6379> SINTER key1 key2 # 交集 共同好友就可以这样实现 1) "c" 127.0.0.1:6379> SUNION key1 key2 # 并集 1) "b" 2) "c" 3) "e" 4) "a" 5) "d"
bilibili:狂神说 Java 微博,A 用户将所有关注的人放在一个 set 集合中!将它的粉丝也放在一个集合中! 共同关注,共同爱好,二度好友,推荐好友!(六度分割理论)
Hash(哈希) Redis hash 是一个 string 类型的 field(字段) 和 value(值) 的映射表,hash 特别适合用于存储对象。
Redis 中每个 hash 可以存储 232 - 1 键值对(40 多亿)。
Map 集合,key-map! 时候这个值是一个 map 集合! 本质和 String 类型没有太大区别,还是一个简单的 key-vlaue!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 BASH ########################################################################## 127.0.0.1:6379> hset myhash field1 kuangshen # set一个具体 key-vlaue (integer) 1 127.0.0.1:6379> hget myhash field1 # 获取一个字段值 "kuangshen" 127.0.0.1:6379> hmset myhash field1 hello field2 world # set多个 key-vlaue OK 127.0.0.1:6379> hmget myhash field1 field2 # 获取多个字段值 1) "hello" 2) "world" 127.0.0.1:6379> hgetall myhash # 获取全部的数据, 1) "field1" 2) "hello" 3) "field2" 4) "world" 127.0.0.1:6379> hdel myhash field1 # 删除hash指定key字段!对应的value值也就消失了! (integer) 1 127.0.0.1:6379> hgetall myhash 1) "field2" 2) "world" ########################################################################## hlen 127.0.0.1:6379> hmset myhash field1 hello field2 world OK 127.0.0.1:6379> HGETALL myhash 1) "field2" 2) "world" 3) "field1" 4) "hello" 127.0.0.1:6379> hlen myhash # 获取hash表的字段数量! (integer) 2 ########################################################################## 127.0.0.1:6379> HEXISTS myhash field1 # 判断hash中指定字段是否存在! (integer) 1 127.0.0.1:6379> HEXISTS myhash field3 (integer) 0 ########################################################################## # 只获得所有field # 只获得所有value 127.0.0.1:6379> hkeys myhash # 只获得所有field 1) "field2" 2) "field1" bilibili:狂神说Javahash变更的数据 user name age,尤其是是用户信息之类的,经常变动的信息! hash 更适合于对象的 存储,String更加适合字符串存储! Zset(有序集合) 在set的基础上,增加了一个值,set k1 v1 zset k1 score1 v1 127.0.0.1:6379> hvals myhash # 只获得所有value 1) "world" 2) "hello" ########################################################################## incr decr 127.0.0.1:6379> hset myhash field3 5 #指定增量! (integer) 1 127.0.0.1:6379> HINCRBY myhash field3 1 (integer) 6 127.0.0.1:6379> HINCRBY myhash field3 -1 (integer) 5 127.0.0.1:6379> hsetnx myhash field4 hello # 如果不存在则可以设置 (integer) 1 127.0.0.1:6379> hsetnx myhash field4 world # 如果存在则不能设置 (integer) 0
hash 变更的数据 user name age,尤其是是用户信息之类的,经常变动的信息! hash 更适合于对象的 存储,String 更加适合字符串存储!
Zset(有序集合) Redis 有序集合和集合一样也是 string 类型元素的集合,且不允许重复的成员。
不同的是每个元素都会关联一个 double 类型的分数。redis 正是通过分数来为集合中的成员进行从小到大的排序。
有序集合的成员是唯一的,但分数(score)却可以重复。
集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是 O(1)。 集合中最大的成员数为 232 - 1 (4294967295, 每个集合可存储 40 多亿个成员)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 BASH 127.0.0.1:6379> zadd myset 1 one # 添加一个值 (integer) 1 127.0.0.1:6379> zadd myset 2 two 3 three # 添加多个值 (integer) 2 127.0.0.1:6379> ZRANGE myset 0 -1 1) "one" 2) "two" 3) "three" ########################################################################## 排序如何实现 127.0.0.1:6379> zadd salary 2500 xiaohong # 添加三个用户 (integer) 1 127.0.0.1:6379> zadd salary 5000 zhangsan (integer) 1 127.0.0.1:6379> zadd salary 500 kaungshen (integer) 1 # ZRANGEBYSCORE key min max 127.0.0.1:6379> ZRANGEBYSCORE salary -inf +inf # 显示全部的用户 从小到大! 1) "kaungshen" 2) "xiaohong" 3) "zhangsan" 127.0.0.1:6379> ZREVRANGE salary 0 -1 # 从大到进行排序! 1) "zhangsan" 2) "kaungshen" 127.0.0.1:6379> ZRANGEBYSCORE salary -inf +inf withscores # 显示全部的用户并且附带成 绩 1) "kaungshen" 2) "500" 3) "xiaohong" 4) "2500" 5) "zhangsan" 6) "5000" 127.0.0.1:6379> ZRANGEBYSCORE salary -inf 2500 withscores # 显示工资小于2500员工的升 序排序! 1) "kaungshen" 2) "500" 3) "xiaohong" 4) "2500" ########################################################################## # 移除rem中的元素 127.0.0.1:6379> zrange salary 0 -1 1) "kaungshen" 2) "xiaohong" 3) "zhangsan" 127.0.0.1:6379> zrem salary xiaohong # 移除有序集合中的指定元素 (integer) 1 127.0.0.1:6379> zrange salary 0 -1 1) "kaungshen" 2) "zhangsan" 127.0.0.1:6379> zcard salary # 获取有序集合中的个数 (integer) 2 ########################################################################## 127.0.0.1:6379> zadd myset 1 hello (integer) 1 127.0.0.1:6379> zadd myset 2 world 3 kuangshen (integer) 2 127.0.0.1:6379> zcount myset 1 3 # 获取指定区间的成员数量! (integer) 3 127.0.0.1:6379> zcount myset 1 2 (integer) 2
其与的一些 API,通过我们的学习吗,你们剩下的如果工作中有需要,这个时候你可以去查查看官方文 档!
案例思路:set 排序 存储班级成绩表,工资表排序!
普通消息,1, 重要消息 2,带权重进行判断!
排行榜应用实现,取 Top N 测试!
三种特殊数据类型 Geospatial 地理位置 朋友的定位,附近的人,打车距离计算?
Redis 的 Geo 在 Redis3.2 版本就推出了! 这个功能可以推算地理位置的信息,两地之间的距离,方圆 几里的人!
可以查询一些测试数据:城市经纬度查询-国内城市经度纬度在线查询工具 (jsons.cn)
Redis GEO 操作方法有:
geoadd:添加地理位置的坐标。
geopos:获取地理位置的坐标。
geodist:计算两个位置之间的距离。
georadius:根据用户给定的经纬度坐标来获取指定范围内的地理位置集合。
georadiusbymember:根据储存在位置集合里面的某个地点获取指定范围内的地理位置集合。
geohash:返回一个或多个位置对象的 geohash 值。
geoadd
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 BASH # getadd 添加地理位置 # 规则:两级无法直接添加,我们一般会下载城市数据,直接通过java程序一次性导入! # 有效的经度从-180度到180度。 # 有效的纬度从-85.05112878度到85.05112878度。 # 当坐标位置超出上述指定范围时,该命令将会返回一个错误。 # 127.0.0.1:6379> geoadd china:city 39.90 116.40 beijin (error) ERR invalid longitude,latitude pair 39.900000,116.400000 # 参数 key 值() 127.0.0.1:6379> geoadd china:city 116.40 39.90 beijing (integer) 1 127.0.0.1:6379> geoadd china:city 121.47 31.23 shanghai (integer) 1 127.0.0.1:6379> geoadd china:city 106.50 29.53 chongqi 114.05 22.52 shengzhen (integer) 2 127.0.0.1:6379> geoadd china:city 120.16 30.24 hangzhou 108.96 34.26 xian (integer) 2
geopos
获得当前定位:一定是一个坐标值!
1 2 3 4 5 6 7 8 9 BASH 127.0.0.1:6379> GEOPOS china:city beijing # 获取指定的城市的经度和纬度! 1) 1) "116.39999896287918091" 2) "39.90000009167092543" 127.0.0.1:6379> GEOPOS china:city beijing chongqi 1) 1) "116.39999896287918091" 2) "39.90000009167092543" 2) 1) "106.49999767541885376" 2) "29.52999957900659211"
GEODIST
两人之间的距离!
单位:
m 表示单位为米
km 表示单位为千米
mi 表示单位为英里
ft 表示单位为英尺
1 2 3 4 5 BASH 127.0.0.1:6379> GEODIST china:city beijing shanghai km # 查看上海到北京的直线距离 "1067.3788" 127.0.0.1:6379> GEODIST china:city beijing chongqi km # 查看重庆到北京的直线距离 "1464.0708"
georadius 以给定的经纬度为中心, 找出某一半径内的元素
我附近的人? (获得所有附近的人的地址,定位!)通过半径来查询!
获得指定数量的人,200
所有数据应该都录入:china:city ,才会让结果更加清晰!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 BASH 127.0.0.1:6379> GEORADIUS china:city 110 30 1000 km # 以110,30 这个经纬度为中心,寻 找方圆1000km内的城市 1) "chongqi" 2) "xian" 3) "shengzhen" 4) "hangzhou" 127.0.0.1:6379> GEORADIUS china:city 110 30 500 km 1) "chongqi" 2) "xian" 127.0.0.1:6379> GEORADIUS china:city 110 30 500 km withdist # 显示到中间距离的位置 1) 1) "chongqi" 2) "341.9374" 2) 1) "xian" 2) "483.8340" 127.0.0.1:6379> GEORADIUS china:city 110 30 500 km withcoord # 显示他人的定位信息 1) 1) "chongqi" 2) 1) "106.49999767541885376" 2) "29.52999957900659211" 2) 1) "xian" 2) 1) "108.96000176668167114" 2) "34.25999964418929977" 127.0.0.1:6379> GEORADIUS china:city 110 30 500 km withdist withcoord count 1 # 筛选出指定的结果! 1) 1) "chongqi" 2) "341.9374" 3) 1) "106.49999767541885376" 2) "29.52999957900659211" 127.0.0.1:6379> GEORADIUS china:city 110 30 500 km withdist withcoord count 2 1) 1) "chongqi" 2) "341.9374" 3) 1) "106.49999767541885376" 2) "29.52999957900659211" 2) 1) "xian" 2) "483.8340" 3) 1) "108.96000176668167114" 2) "34.25999964418929977"
GEORADIUSBYMEMBER
1 2 3 4 5 6 7 8 BASH # 找出位于指定元素周围的其他元素! 127.0.0.1:6379> GEORADIUSBYMEMBER china:city beijing 1000 km 1) "beijing" 2) "xian" 127.0.0.1:6379> GEORADIUSBYMEMBER china:city shanghai 400 km 1) "hangzhou" 2) "shanghai"
GEOHASH 命令 - 返回一个或多个位置元素的 Geohash 表示
该命令将返回 11 个字符的 Geohash 字符串~
1 2 3 4 5 BASH # 将二维的经纬度转换为一维的字符串,如果两个字符串越接近,那么则距离越近! 127.0.0.1:6379> geohash china:city beijing chongqi 1) "wx4fbxxfke0" 2) "wm5xzrybty0"
GEO 底层的实现原理其实就是 Zset!我们可以使用过 Zset 命令来操作 geo!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 BASH 127.0.0.1:6379> ZRANGE china:city 0 -1 # 查看地图中全部的元素 1) "chongqi" 2) "xian" 3) "shengzhen" 4) "hangzhou" 5) "shanghai" 6) "beijing" 127.0.0.1:6379> zrem china:city beijing # 移除指定元素! (integer) 1 127.0.0.1:6379> ZRANGE china:city 0 -1 1) "chongqi" 2) "xian" 3) "shengzhen" 4) "hangzhou" 5) "shanghai"
Hyperloglog Redis 在 2.8.9 版本添加了 HyperLogLog 结构。
Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。
在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基 数。这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。
但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以 HyperLogLog 不能像集合那样,返回输入的各个元素。
什么是基数?
A {1,3,5,7,8,7}
B{1,3,5,7,8}
基数(不重复的元素) = 5,可以接受误差!
优点:占用的内存是固定,2^64 不同的元素的基数,只需要废 12KB 内存!如果要从内存角度来比较的 话 Hyperloglog 首选!
网页的 UV (一个人访问一个网站多次,但是还是算作一个人!)
传统的方式, set 保存用户的 id,然后就可以统计 set 中的元素数量作为标准判断 !
这个方式如果保存大量的用户 id,就会比较麻烦!我们的目的是为了计数,而不是保存用户 id;
0.81% 错误率! 统计 UV 任务,可以忽略不计的!
序号
命令及描述
1
[PFADD key element element …] 添加指定元素到 HyperLogLog 中。
2
[PFCOUNT key key …] 返回给定 HyperLogLog 的基数估算值。
3
[PFMERGE destkey sourcekey sourcekey …] 将多个 HyperLogLog 合并为一个 HyperLogLog
测试使用
1 2 3 4 5 6 7 8 9 10 11 12 13 BASH 127.0.0.1:6379> PFadd mykey a b c d e f g h i j # 创建第一组元素 mykey (integer) 1 127.0.0.1:6379> PFCOUNT mykey # 统计 mykey 元素的基数数量 (integer) 10 127.0.0.1:6379> PFadd mykey2 i j z x c v b n m # 创建第二组元素 mykey2 (integer) 1 127.0.0.1:6379> PFCOUNT mykey2 (integer) 9 127.0.0.1:6379> PFMERGE mykey3 mykey mykey2 # 合并两组 mykey mykey2 => mykey3 并集 OK 127.0.0.1:6379> PFCOUNT mykey3 # 看并集的数量! (integer) 15
Bitmap 为什么其他教程都不喜欢讲这些?这些在生活中或者开发中,都有十分多的应用场景,学习了,就是就 是多一个思路!
技多不压身!
位储存
统计用户信息,活跃,不活跃! 登录 、 未登录! 打卡,365 打卡! 两个状态的,都可以使用 Bitmaps!
Bitmap 位图,数据结构! 都是操作二进制位来进行记录,就只有 0 和 1 两个状态!
365 天 = 365 bit 1 字节 = 8bit 46 个字节左右!
测试
使用 bitmap 来记录 周一到周日的打卡!
周一:1 周二:0 周三:0 周四:1 ……
查看某一天是否有打卡!
1 2 3 4 5 BASH 127.0.0.1:6379> getbit sign 3 (integer) 1 127.0.0.1:6379> getbit sign 6 (integer) 0
统计操作,统计 打卡的天数!
1 2 3 BASH 127.0.0.1:6379> bitcount sign # 统计这周的打卡记录,就可以看到是否有全勤! (integer) 3
事务 Redis 事务本质:一组命令的集合! 一个事务中的所有命令都会被序列化,在事务执行过程的中,会按 照顺序执行!
一次性、顺序性、排他性!执行一系列的命令!
1 ------ 队列 set set set 执行------
==Redis 事务没有没有隔离级别的概念!==
所有的命令在事务中,并没有直接被执行!只有发起执行命令的时候才会执行!Exec
==Redis 单条命令式保存原子性的,但是事务不保证原子性!==
redis 的事务:
开启事务(multi)
命令入队(……)
执行事务(exec)
正常执行事务!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 BASH 127.0.0.1:6379> multi # 开启事务 OK # 命令入队 127.0.0.1:6379> set k1 v1 QUEUED 127.0.0.1:6379> set k2 v2 QUEUED 127.0.0.1:6379> get k2 QUEUED 127.0.0.1:6379> set k3 v3 QUEUED 127.0.0.1:6379> exec # 执行事务 1) OK 2) OK 3) "v2" 4) OK
放弃事务
1 2 3 4 5 6 7 8 9 10 11 12 13 BASH 127.0.0.1:6379> multi # 开启事务 OK 127.0.0.1:6379> set k1 v1 QUEUED 127.0.0.1:6379> set k2 v2 QUEUED 127.0.0.1:6379> set k4 v4 QUEUED 127.0.0.1:6379> DISCARD # 取消事务 OK 127.0.0.1:6379> get k4 # 事务队列中命令都不会被执行! (nil)
编译型异常(代码有问题!命令有错!),事务中所有的命令都不会执行!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 BASH 127.0.0.1:6379> multi OK 127.0.0.1:6379> set k1 v1 QUEUED 127.0.0.1:6379> set k2 v2 QUEUED 127.0.0.1:6379> set k3 v3 QUEUED 127.0.0.1:6379> getset k3 # 错误的命令 (error) ERR wrong number of arguments for 'getset' command 127.0.0.1:6379> set k4 v4 QUEUED 127.0.0.1:6379> set k5 v5 QUEUED 127.0.0.1:6379> exec # 执行事务报错! (error) EXECABORT Transaction discarded because of previous errors. 127.0.0.1:6379> get k5 # 所有的命令都不会被执行! (nil)
运行时异常(1/0), 如果事务队列中存在语法性,那么执行命令的时候,其他命令是可以正常执行 的,错误命令抛出异常!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 BASH 127.0.0.1:6379> set k1 "v1" OK 127.0.0.1:6379> multi OK 127.0.0.1:6379> incr k1 # 会执行的时候失败! QUEUED 127.0.0.1:6379> set k2 v2 QUEUED 127.0.0.1:6379> set k3 v3 QUEUED 127.0.0.1:6379> get k3 QUEUED 127.0.0.1:6379> exec 1) (error) ERR value is not an integer or out of range # 虽然第一条命令报错了,但是依旧正常执行成功了! 2) OK 3) OK 4) "v3" 127.0.0.1:6379> get k2 "v2" 127.0.0.1:6379> get k3 "v3"
监控! Watch (面试常问!)
悲观锁:
很悲观,认为什么时候都会出问题,无论做什么都会加锁!
乐观锁:
很乐观,认为什么时候都不会出问题,所以不会上锁! 更新数据的时候去判断一下,在此期间是否 有人修改过这个数据
获取 version
更新的时候比较 version
Redis 监视测试
正常执行成功!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 BASH 127.0.0.1:6379> set money 100 OK 127.0.0.1:6379> set out 0 OK 127.0.0.1:6379> watch money # 监视 money 对象 OK 127.0.0.1:6379> multi # 事务正常结束,数据期间没有发生变动,这个时候就正常执行成功! OK 127.0.0.1:6379> DECRBY money 20 QUEUED 127.0.0.1:6379> INCRBY out 20 QUEUED 127.0.0.1:6379> exec 1) (integer) 80 2) (integer) 20
测试多线程修改值 , 使用 watch 可以当做 redis 的乐观锁操作!
1 2 3 4 5 6 7 8 9 10 11 BASH 127.0.0.1:6379> watch money # 监视 money OK 127.0.0.1:6379> multi OK 127.0.0.1:6379> DECRBY money 10 QUEUED 127.0.0.1:6379> INCRBY out 10 QUEUED 127.0.0.1:6379> exec # 执行之前,另外一个线程,修改了我们的值,这个时候,就会导致事务执行失败! (nil)
如果修改失败,获取最新的值就好
Jedis 我们要使用 Java 来操作 Redis,知其然并知其所以然,授人以渔! 学习不能急躁,慢慢来会很快!
什么是 Jedis 是 Redis 官方推荐的 java 连接开发工具! 使用 Java 操作 Redis 中间件!如果你要使用 java 操作 redis,那么一定要对 jedis 十分熟悉!
测试
1、导入对应的依赖
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 XML <!--导入jedis的包--> <dependencies> <!-- https://mvnrepository.com/artifact/redis.clients/jedis --> <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>3.2.0</version> </dependency> <!--fastjson--> <dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson</artifactId> <version>1.2.62</version> </dependency> </dependencies>
2、编码测试
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 JAVA import redis.clients.jedis.Jedis; /** * @author IRVING * @create 2021-05-03 0:20 */ public class TestPing { public static void main(String[] args) { // 1、 new Jedis 对象即可 Jedis jedis = new Jedis("127.0.0.1",6379); jedis.auth("123456"); // 2、jedis 所有的命令就是我们之前学习的所有指令!所以之前的指令学习很重要! System.out.println(jedis.ping()); } }
输出:
常用的 API
string
list
set
hash
zset
geo
bitmap
hyperloglog
所有的 api 命令,就是我们对应的上面学习的指令,一个都没有变化!
事务
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 JAVA import com.alibaba.fastjson.JSONObject; import redis.clients.jedis.Jedis; import redis.clients.jedis.Transaction; /** * @author IRVING * @create 2021-05-03 0:31 */ public class TestTX { public static void main(String[] args) { // 1、 new Jedis 对象即可 Jedis jedis = new Jedis("127.0.0.1",6379); jedis.auth("123456"); jedis.flushDB(); JSONObject jsonObject = new JSONObject(); jsonObject.put("hello","world"); jsonObject.put("name","ouwen"); //开启事务 Transaction multi = jedis.multi(); String result = jsonObject.toJSONString(); try { multi.set("user1",result); int i = 1/0; multi.set("user2",result); //执行事务 multi.exec(); } catch (Exception e) { //放弃事务 multi.discard(); e.printStackTrace(); } finally { System.out.println(jedis.get("user1")); System.out.println(jedis.get("user2")); //关闭连接 jedis.close(); } } }
SpringBoot 整合 SpringBoot 操作数据:spring-data jpa jdbc mongodb redis!
SpringData 也是和 SpringBoot 齐名的项目!
说明: 在 SpringBoot2.x 之后,原来使用的 jedis 被替换为了 lettuce?
jedis : 采用的直连,多个线程操作的话,是不安全的,如果想要避免不安全的,使用 jedis pool 连接 池! 更像 BIO 模式
lettuce : 采用 netty,实例可以再多个线程中进行共享,不存在线程不安全的情况!可以减少线程数据 了,更像 NIO 模式
源码分析:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 JAVA @Bean @ConditionalOnMissingBean(name = "redisTemplate") // 我们可以自己定义一个 redisTemplate来替换这个默认的! public RedisTemplate<Object, Object> redisTemplate(RedisConnectionFactory redisConnectionFactory) throws UnknownHostException { // 默认的 RedisTemplate 没有过多的设置,redis 对象都是需要序列化! // 两个泛型都是 Object, Object 的类型,我们后使用需要强制转换 <String, Object> RedisTemplate<Object, Object> template = new RedisTemplate<>(); template.setConnectionFactory(redisConnectionFactory); return template; } @Bean @ConditionalOnMissingBean // 由于 String 是redis中最常使用的类型,所以说单独提出来了一个bean! public StringRedisTemplate stringRedisTemplate(RedisConnectionFactory redisConnectionFactory) throws UnknownHostException { StringRedisTemplate template = new StringRedisTemplate(); template.setConnectionFactory(redisConnectionFactory); return template; }
整合测试一下
1、导入依赖
1 2 3 4 5 XML <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-redis</artifactId> </dependency>
2、配置连接
1 2 3 4 5 6 YAML spring: redis: host: 127.0.0.1 port: 6379 password: 123456
3、测试!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 JAVA package com.luojunjie; import org.junit.jupiter.api.Test; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.boot.test.context.SpringBootTest; import org.springframework.data.redis.connection.RedisConnection; import org.springframework.data.redis.core.RedisTemplate; @SpringBootTest class Redis02SpringbootApplicationTests { @Autowired private RedisTemplate redisTemplate; @Test void contextLoads() { // redisTemplate 操作不同的类型,api和我们的指令是一样的 // opsForValue 操作字符串 类似string // opsForList // opsForSet // opsForZSet // opsForHash // opsForGeo // opsForHyperLogLog //redisTemplate.opsForValue(); //除了基本的操作,我们常用的方法都可以直接通过redisTemplate操作,比如事务和基本的CRUD // 获取redis连接对象 //RedisConnection conn = redisTemplate.getConnectionFactory().getConnection(); //conn.flushAll(); //conn.flushDb(); redisTemplate.opsForValue().set("mykey","湖南长沙"); System.out.println(redisTemplate.opsForValue().get("mykey")); } }
我们来编写一个自己的 RedisTemplete
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 JAVA package com.luojunjie.config; import com.fasterxml.jackson.annotation.JsonAutoDetect; import com.fasterxml.jackson.annotation.PropertyAccessor; import com.fasterxml.jackson.databind.ObjectMapper; import org.springframework.boot.autoconfigure.condition.ConditionalOnMissingBean; import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.data.redis.connection.RedisConnectionFactory; import org.springframework.data.redis.core.RedisTemplate; import org.springframework.data.redis.serializer.Jackson2JsonRedisSerializer; import org.springframework.data.redis.serializer.StringRedisSerializer; import java.net.UnknownHostException; /** * @author IRVING * @create 2021-05-03 10:24 */ @Configuration public class RedisConfig { // 这是我给大家写好的一个固定模板,大家在企业中,拿去就可以直接使用! // 自己定义了一个 RedisTemplate @Bean @SuppressWarnings("all") public RedisTemplate<String, Object> redisTemplate(RedisConnectionFactory factory) { // 我们为了自己开发方便,一般直接使用 <String, Object> RedisTemplate<String, Object> template = new RedisTemplate<String, Object>(); template.setConnectionFactory(factory); // Json序列化配置 Jackson2JsonRedisSerializer jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer(Object.class); ObjectMapper om = new ObjectMapper(); om.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY); om.enableDefaultTyping(ObjectMapper.DefaultTyping.NON_FINAL); jackson2JsonRedisSerializer.setObjectMapper(om); // String 的序列化 StringRedisSerializer stringRedisSerializer = new StringRedisSerializer(); // key采用String的序列化方式 template.setKeySerializer(stringRedisSerializer); // hash的key也采用String的序列化方式 template.setHashKeySerializer(stringRedisSerializer); // value序列化方式采用jackson template.setValueSerializer(jackson2JsonRedisSerializer); // hash的value序列化方式采用jackson template.setHashValueSerializer(jackson2JsonRedisSerializer); template.afterPropertiesSet(); return template; } }
所有的 redis 操作,其实对于 java 开发人员来说,十分的简单,更重要是要去理解 redis 的思想和每一种数 据结构的用处和作用场景!
Redis.conf 详解 启动的时候,就通过配置文件来启动!
工作中,一些小小的配置,可以让你脱颖而出!
单位
配置文件对大小写不敏感!
包含
就是好比我们学习 Spring、Improt, include
网络
1 2 3 4 BASH bind 127.0.0.1 # 绑定的ip protected-mode yes # 保护模式 port 6379 # 端口设置
通用 GENERAL
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 BASH daemonize yes # 以守护进程的方式运行,默认是 no,我们需要自己开启为yes! pidfile /var/run/redis_6379.pid # 如果以后台的方式运行,我们就需要指定一个 pid 文件! # 日志 # Specify the server verbosity level. # This can be one of: # debug (a lot of information, useful for development/testing) # verbose (many rarely useful info, but not a mess like the debug level) # notice (moderately verbose, what you want in production probably) 生产环境 # warning (only very important / critical messages are logged) loglevel notice logfile "" # 日志的文件位置名 databases 16 # 数据库的数量,默认是 16 个数据库 always-show-logo yes # 是否总是显示LOGO
快照
持久化, 在规定的时间内,执行了多少次操作,则会持久化到文件 .rdb. aof
redis 是内存数据库,如果没有持久化,那么数据断电就会丢失!
1 2 3 4 5 6 7 8 9 10 11 12 BASH # 如果900s内,如果至少有一个1 key进行了修改,我们及进行持久化操作 save 900 1 # 如果300s内,如果至少10 key进行了修改,我们及进行持久化操作 save 300 10 # 如果60s内,如果至少10000 key进行了修改,我们及进行持久化操作 save 60 10000 # 我们之后学习持久化,会自己定义这个测试! stop-writes-on-bgsave-error yes # 持久化如果出错,是否还需要继续工作! rdbcompression yes # 是否压缩 rdb 文件,需要消耗一些cpu资源! rdbchecksum yes # 保存rdb文件的时候,进行错误的检查校验! dir ./ # rdb 文件保存的目录!
SECURITY 安全
可以设置 redis 密码,默认是没有密码的
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 BASH 127.0.0.1:6379> ping PONG 127.0.0.1:6379> config get requirepass # 获取redis的密码 1) "requirepass" 2) "" 127.0.0.1:6379> config set requirepass "123456" # 设置redis的密码 OK 127.0.0.1:6379> config get requirepass # 发现所有的命令都没有权限了 (error) NOAUTH Authentication required. 127.0.0.1:6379> ping (error) NOAUTH Authentication required. 127.0.0.1:6379> auth 123456 # 使用密码进行登录! OK 127.0.0.1:6379> config get requirepass 1) "requirepass" 2) "123456"
限制 CLIENTS
1 2 3 4 5 6 7 8 9 10 11 12 BASH maxclients 10000 # 设置能连接上redis的最大客户端的数量 maxmemory <bytes> # redis 配置最大的内存容量 maxmemory-policy noeviction # 内存到达上限之后的处理策略 1、volatile-lru:只对设置了过期时间的key进行LRU(默认值) 2、allkeys-lru : 删除lru算法的key 3、volatile-random:随机删除即将过期key 4、allkeys-random:随机删除 5、volatile-ttl : 删除即将过期的 6、noeviction : 永不过期,返回错误
APPEND ONLY 模式 aof 配置
1 2 3 4 5 6 7 BASH appendonly no # 默认是不开启aof模式的,默认是使用rdb方式持久化的,在大部分所有的情况下,rdb完全够用! appendfilename "appendonly.aof" # 持久化的文件的名字 # appendfsync always # 每次修改都会 sync。消耗性能 appendfsync everysec # 每秒执行一次 sync,可能会丢失这1s的数据! # appendfsync no # 不执行 sync,这个时候操作系统自己同步数据,速度最快!
Redis 持久化 面试和工作,持久化都是重点!
Redis 是内存数据库,如果不将内存中的数据库状态保存到磁盘 ,那么一旦服务器进程退出,服务器中的数据库状态也会消失。所以 Redis 提供了持久化功能!
RDB(Redis DataBase)
什么是 RDB?
在主从复制中,rdb 就是备用了,放在从机上。
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的 Snapshot 快照,它恢复时是将快 照文件直接读到内存里。
Redis 会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程 都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何 IO 操作的。 这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那 RDB 方式要比 AOF 方式更加的高效。RDB 的缺点是最后一次持久化后的数据可能丢失。我们默认的就是 RDB,一般情况下不需要修改这个配置!
==rdb 保存的文件是 dump.rdb== 都是在我们的配置文件中快照中进行配置的!
触发机制
1、save 的规则满足的情况下,会自动触发 rdb 规则
2、执行 flushall 命令,也会触发我们的 rdb 规则!
3、退出 redis,也会产生 rdb 文件! 备份就自动生成一个 dump.rdb
如何恢复 rdb 文件!
1、只需要将 rdb 文件放在我们 redis 启动目录就可以,redis 启动的时候会自动检查 dump.rdb 恢复其中 的数据!
2、查看需要存在的位置
1 2 3 4 BASH 127.0.0.1:6379> config get dir 1) "dir" 2) "/usr/local/bin" # 如果在这个目录下存在 dump.rdb 文件,启动就会自动恢复其中的数据
优点:
1、适合大规模的数据恢复!
2、对数据的完整性要不高!
缺点:
1、需要一定的时间间隔进程操作!如果 redis 意外宕机了,这个最后一次修改数据就没有的了!
2、fork 进程的时候,会占用一定的内容空间!
AOF(Append Only File) 将我们的所有命令都记录下来,history,恢复的时候就把这个文件全部在执行一遍!
是什么?
以日志的形式来记录每个写操作,将 Redis 执行过的所有指令记录下来(读操作不记录),只许追加文件 但不可以改写文件,redis 启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件 的内容将写指令从前到后执行一次以完成数据的恢复工作。
==AOF 保存的是appendonly.aof
文件==
append
默认是不开启的,我们需要手动进行配置!我们只需要将 appendonly 改为 yes 就开启了 aof! 重启,redis 就可以生效了!
如果这个 aof 文件有错误,这时候 redis 是启动不起来的,我们需要修复这个 aof 文件
redis 给我们提供了一个工具 redis-check-aof --fix
如果文件正常,重启就可以直接恢复了!
重写规则说明
aof 默认就是文件的无限追加,文件会越来越大!
如果 aof 文件大于 64m,太大了! fork 一个新的进程来将我们的文件进行重写!
优点和缺点!
1 2 3 4 5 6 7 BASH appendonly no # 默认是不开启aof模式的,默认是使用rdb方式持久化的,在大部分所有的情况下,rdb完全够用! appendfilename "appendonly.aof" # 持久化的文件的名字 # appendfsync always # 每次修改都会 sync。消耗性能 appendfsync everysec # 每秒执行一次 sync,可能会丢失这1s的数据! # appendfsync no # 不执行 sync,这个时候操作系统自己同步数据,速度最快!
优点:
1、每一次修改都同步,文件的完整会更加好!
2、每秒同步一次,可能会丢失一秒的数据
3、从不同步,效率最高的!
缺点:
1、相对于数据文件来说,aof 远远大于 rdb,修复的速度也比 rdb 慢!
2、Aof 运行效率也要比 rdb 慢,所以我们 redis 默认的配置就是 rdb 持久化!
扩展:
1、RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储
2、AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始 的数据,AOF 命令以 Redis 协议追加保存每次写的操作到文件末尾,Redis 还能对 AOF 文件进行后台重 写,使得 AOF 文件的体积不至于过大。
3、==只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化==
4、同时开启两种持久化方式
在这种情况下,当 redis 重启的时候会优先载入 AOF 文件来恢复原始的数据,因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。
RDB 的数据不实时,同时使用两者时服务器重启也只会找 AOF 文件,那要不要只使用 AOF 呢?作者 建议不要,因为 RDB 更适合用于备份数据库(AOF 在不断变化不好备份),快速重启,而且不会有 AOF 可能潜在的 Bug,留着作为一个万一的手段。
5、性能建议
因为 RDB 文件只用作后备用途,建议只在 Slave 上持久化 RDB 文件,而且只要 15 分钟备份一次就够 了,只保留 save 900 1 这条规则。
如果 Enable AOF ,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只 load 自 己的 AOF 文件就可以了,代价一是带来了持续的 IO,二是 AOF rewrite 的最后将 rewrite 过程中产 生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少 AOF rewrite 的频率,AOF 重写的基础大小默认值 64M 太小了,可以设到 5G 以上,默认超过原大小 100%大小重 写可以改到适当的数值。
如果不 Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔 IO,也 减少了 rewrite 时带来的系统波动。代价是如果 Master/Slave 同时倒掉,会丢失十几分钟的数据, 启动脚本也要比较两个 Master/Slave 中的 RDB 文件,载入较新的那个,微博就是这种架构。
Redis 发布订阅 Redis 发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者(sub)接收消息。微信、 微博、关注系统!
Redis 客户端可以订阅任意数量的频道。
订阅/发布消息图:
第一个:消息发送者, 第二个:频道 第三个:消息订阅者!
下图展示了频道 channel1 , 以及订阅这个频道的三个客户端 —— client2 、 client5 和 client1 之间的 关系:
当有新消息通过 PUBLISH 命令发送给频道 channel1 时, 这个消息就会被发送给订阅它的三个客户端:
命令
这些命令被广泛用于构建即时通信应用,比如网络聊天室(chatroom)和实时广播、实时提醒等。
测试
订阅端:
1 2 3 4 5 6 7 8 9 10 11 12 BASH [root@ouwen owconfig]# ../ -bash: ../: Is a directory [root@ouwen owconfig]# redis-cli 127.0.0.1:6379> SUBSCRIBE ouwenshuo Reading messages... (press Ctrl-C to quit) 1) "subscribe" 2) "ouwenshuo" 3) (integer) 1 1) "message" #消息 2) "ouwenshuo" #哪个频道的消息 3) "hello redis" #消息内容
发送端:
1 2 3 BASH 127.0.0.1:6379> PUBLISH ouwenshuo "hello redis" #发布者发布消息到频道! (integer) 1
原理
Redis 是使用 C 实现的,通过分析 Redis 源码里的 pubsub.c 文件,了解发布和订阅机制的底层实现,借此加深对 Redis 的理解。
Redis 通过 PUBLISH 、SUBSCRIBE 和 PSUBSCRIBE 等命令实现发布和订阅功能。
通过 SUBSCRIBE 命令订阅某频道后,redis-server 里维护了一个字典,字典的键就是一个个 频道!, 而字典的值则是一个链表,链表中保存了所有订阅这个 channel 的客户端。SUBSCRIBE 命令的关键, 就是将客户端添加到给定 channel 的订阅链表中。
通过 PUBLISH 命令向订阅者发送消息,redis-server 会使用给定的频道作为键,在它所维护的 channel 字典中查找记录了订阅这个频道的所有客户端的链表,遍历这个链表,将消息发布给所有订阅者。
Pub/Sub 从字面上理解就是发布(Publish)与订阅(Subscribe),在 Redis 中,你可以设定对某一个 key 值进行消息发布及消息订阅,当一个 key 值上进行了消息发布后,所有订阅它的客户端都会收到相应 的消息。这一功能最明显的用法就是用作实时消息系统,比如普通的即时聊天,群聊等功能。
使用场景:
1、实时消息系统!
2、实时聊天!(频道当做聊天室,将信息回显给所有人即可!)
3、订阅,关注系统都是可以的! 稍微复杂的场景我们就会使用 消息中间件 MQ ()
Redis 主从复制 概念 主从复制,是指将一台 Redis 服务器的数据,复制到其他的 Redis 服务器。前者称为主节点 (master/leader),后者称为从节点(slave/follower);数据的复制是单向的,只能由主节点到从节点。 Master 以写为主,Slave 以读为主。
==默认情况下,每台 Redis 服务器都是主节点;==
且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
主从复制的作用主要包括:
1、数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
2、故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务 的冗余。
3、负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务 (即写 Redis 数据时应用连接主节点,读 Redis 数据时应用连接从节点),分担服务器负载;尤其是在写 少读多的场景下,通过多个从节点分担读负载,可以大大提高 Redis 服务器的并发量。
4、高可用(集群)基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是 Redis 高可用的基础。
一般来说,要将 Redis 运用于工程项目中,只使用一台 Redis 是万万不能的(宕机),原因如下:
1、从结构上,单个 Redis 服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较 大;
2、从容量上,单个 Redis 服务器内存容量有限,就算一台 Redis 服务器内存容量为 256G,也不能将所有 内存用作 Redis 存储内存,一般来说,单台 Redis 最大使用内存不应该超过 20G。 电商网站上的商品,一般都是一次上传,无数次浏览的,说专业点也就是”多读少写”。
对于这种场景,我们可以使如下这种架构:
主从复制,读写分离! 80% 的情况下都是在进行读操作!减缓服务器的压力!架构中经常使用! 一主 二从!
只要在公司中,主从复制就是必须要使用的,因为在真实的项目中不可能单机使用 Redis!
环境配置 只配置从库,不用配置主库!
1 2 3 4 5 6 7 8 9 10 11 12 13 BASH 127.0.0.1:6379> info replication # 查看当前库的信息 # Replication role:master # 角色 master connected_slaves:0 # 没有从机 master_replid:b63c90e6c501143759cb0e7f450bd1eb0c70882a master_replid2:0000000000000000000000000000000000000000 master_repl_offset:0 second_repl_offset:-1 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0
复制 3 个配置文件,然后修改对应的信息:
1、端口
2、pid 名字
3、log 文件名字
4、dump.rdb 名字
修改完毕之后,启动我们的 3 个 redis 服务器,可以通过进程信息查看~
一主二从 ==默认情况下,每台 Redis 服务器都是主节点;==我们一般情况下只用配置从机就好了!
认老大! 一主 (79)二从(80,81)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 BASH 127.0.0.1:6380> SLAVEOF 127.0.0.1 6379 #SLAVEOF host port 找谁当自己的老大 认主机 OK 127.0.0.1:6380> info replication # Replication role:slave #当前角色是从机 master_host:127.0.0.1 #可以看到主机的信息 master_port:6379 master_link_status:up master_last_io_seconds_ago:2 master_sync_in_progress:0 slave_repl_offset:0 slave_priority:100 slave_read_only:1 connected_slaves:0 master_replid:e3379979becc4e424bf681c1a5fe7672bee18d37 master_replid2:0000000000000000000000000000000000000000 master_repl_offset:0 second_repl_offset:-1 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:1 repl_backlog_histlen:0 #在主机中查看 127.0.0.1:6379> info replication # Replication role:master connected_slaves:1 #多了从机的配置 slave0:ip=127.0.0.1,port=6380,state=online,offset=28,lag=0 #可以查看从机的信息 master_replid:e3379979becc4e424bf681c1a5fe7672bee18d37 master_replid2:0000000000000000000000000000000000000000 master_repl_offset:28 second_repl_offset:-1 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:1 repl_backlog_histlen:28
如果两个都配置完了,就是有两个从机的
真实的从主配置应该在配置文件中配置,这样的话是永久的,我们这里使用的是命令,暂时的!
细节
主机可以写,从机不能写只能读!主机中的所有信息和数据,都会自动被从机保存!
主机写:
从机只能读取内容!
测试:主机断开连接,从机依旧连接到主机的,但是没有写操作,这个时候,主机如果回来了,从机依旧可以直接获取到主机写的信息!
如果是使用命令行,来配置的主从,这个时候如果重启了,就会变回主机!只要变为从机,立马就会从 主机中获取值!
复制原理
Slave 启动成功连接到 master 后会发送一个 sync 同步命令
Master 接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行 完毕之后,==master 将传送整个数据文件到 slave,并完成一次完全同步。==
全量复制:而 slave 服务在接收到数据库文件数据后,将其存盘并加载到内存中。
增量复制:Master 继续将新的所有收集到的修改命令依次传给 slave,完成同步
但是只要是重新连接 master,一次完全同步(全量复制)将被自动执行! 我们的数据一定可以在从机中 看到!
层层链路
上一个 M 链接下一个 S!
这时候也可以完成我们的主从复制!
如果没有老大了,这个时候能不能选择一个老大出来呢? 手动!
==谋朝篡位==
如果主机断开了连接,我们可以使用SLAVEOF no one
让自己变成主机!其他的节点就可以手动连 接到最新的这个主节点(手动)!如果这个时候老大修复了,那就重新连接!
哨兵模式 (自动选举老大的模式)
概述
主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工 干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑 哨兵模式。Redis 从 2.8 开始正式提供了 Sentinel(哨兵) 架构来解决这个问题。
谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数==自动将从库转换为主库==。
哨兵模式是一种特殊的模式,首先 Redis 提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待 Redis 服务器响应,从而监控运行的多个 Redis 实例。
这里的哨兵有两个作用
通过发送命令,让 Redis 服务器返回监控其运行状态,包括主服务器和从服务器。
当哨兵监测到 master 宕机,会自动将 slave 切换成 master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。
然而一个哨兵进程对 Redis 服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。
假设主服务器宕机,哨兵 1 先检测到这个结果,系统并不会马上进行 failover 过程,仅仅是哨兵 1 主观的认 为主服务器不可用,这个现象成为主观下线 。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行 failover[故障转移]操作。 切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为 客观下线 。
测试!
目前的状态是:一主二从!
1、配置哨兵配置文件 sentinel.conf
1 2 3 BASH # sentinel monitor 被监控的名称 host port 1 sentinel monitor myredis 127.0.0.1 6379 1
后面的这个数字 1,代表主机挂了,slave 投票看让谁接替成为主机,票数最多的,就会成为主机!
2、启动哨兵
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 BASH [root@ouwen bin]# redis-sentinel owconfig/sentinel.conf 5922:X 03 May 2021 18:13:03.144 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo 5922:X 03 May 2021 18:13:03.144 # Redis version=5.0.8, bits=64, commit=00000000, modified=0, pid=5922, just started 5922:X 03 May 2021 18:13:03.144 # Configuration loaded _._ _.-``__ ''-._ _.-`` `. `_. ''-._ Redis 5.0.8 (00000000/0) 64 bit .-`` .-```. ```\/ _.,_ ''-._ ( ' , .-` | `, ) Running in sentinel mode |`-._`-...-` __...-.``-._|'` _.-'| Port: 26379 | `-._ `._ / _.-' | PID: 5922 `-._ `-._ `-./ _.-' _.-' |`-._`-._ `-.__.-' _.-'_.-'| | `-._`-._ _.-'_.-' | http://redis.io `-._ `-._`-.__.-'_.-' _.-' |`-._`-._ `-.__.-' _.-'_.-'| | `-._`-._ _.-'_.-' | `-._ `-._`-.__.-'_.-' _.-' `-._ `-.__.-' _.-' `-._ _.-' `-.__.-' 5922:X 03 May 2021 18:13:03.145 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128. 5922:X 03 May 2021 18:13:03.150 # Sentinel ID is 0ab5ef20110ebfc67bc2a5e93addbe0871ffd748 5922:X 03 May 2021 18:13:03.150 # +monitor master myredis 127.0.0.1 6379 quorum 1 5922:X 03 May 2021 18:13:03.151 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379 5922:X 03 May 2021 18:13:03.156 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
如果 Master 节点断开了,这个时候就会从从机中随机选择一个服务器!(这里面有一个投票算法!)
哨兵日志:
如果主机此时回来了,==只能归并到新的主机下,当做从机==,这就是哨兵模式的规则!
哨兵模式
优点:
1、哨兵集群,基于主从复制模式,所有的主从配置优点,它全有
2、主从可以切换,故障可以转移,系统的可用性就会更好
3、哨兵模式就是主从模式的升级,手动到自动,更加健壮!
缺点:
1、Redis 不好做在线扩容的,集群容量一旦达到上限,在线扩容就会十分麻烦!
2、实现哨兵模式的配置其实是很麻烦的,里面有很多选择!
哨兵模式的全部配置!!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 BASH # Example sentinel.conf # 哨兵sentinel实例运行的端口 默认26379 port 26379 # 哨兵sentinel的工作目录 dir /tmp # 哨兵sentinel监控的redis主节点的 ip port # master-name 可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。 # quorum 配置多少个sentinel哨兵统一认为master主节点失联 那么这时客观上认为主节点失联了 # sentinel monitor <master-name> <ip> <redis-port> <quorum> sentinel monitor mymaster 127.0.0.1 6379 2 # 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码 # 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码 # sentinel auth-pass <master-name> <password> sentinel auth-pass mymaster MySUPER--secret-0123passw0rd # 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒 # sentinel down-after-milliseconds <master-name> <milliseconds> sentinel down-after-milliseconds mymaster 30000 # 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步,这个数字越小,完成failover所需的时间就越长,但是如果这个数字越大,就意味着越 多的slave因为replication而不可用。可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。 # sentinel parallel-syncs <master-name> <numslaves> sentinel parallel-syncs mymaster 1 # 故障转移的超时时间 failover-timeout 可以用在以下这些方面: #1. 同一个sentinel对同一个master两次failover之间的间隔时间。 #2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那 里同步数据时。 #3.当想要取消一个正在进行的failover所需要的时间。 #4.当进行failover时,配置所有slaves指向新的master所需的最大时间。不过,即使过了这个超时, slaves依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了 # 默认三分钟 # sentinel failover-timeout <master-name> <milliseconds> sentinel failover-timeout mymaster 180000 # SCRIPTS EXECUTION #配置当某一事件发生时所需要执行的脚本,可以通过脚本来通知管理员,例如当系统运行不正常时发邮件通知 相关人员。 #对于脚本的运行结果有以下规则: #若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10 #若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。 #如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。 #一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被一个SIGKILL信号终止,之后重新执行。 #通知型脚本:当sentinel有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本,这时这个脚本应该通过邮件,SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,一个是事件的类型,一个是事件的描述。如果sentinel.conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentinel无法正常启动成功。 #通知脚本 # shell编程 # sentinel notification-script <master-name> <script-path> sentinel notification-script mymaster /var/redis/notify.sh # 客户端重新配置主节点参数脚本 # 当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生改变的信息。 # 以下参数将会在调用脚本时传给脚本: # <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port> # 目前<state>总是“failover”, # <role>是“leader”或者“observer”中的一个。 # 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的 # 这个脚本应该是通用的,能被多次调用,不是针对性的。 # sentinel client-reconfig-script <master-name> <script-path> sentinel client-reconfig-script mymaster /var/redis/reconfig.sh # 一般都是由运维来配置!
Redis 缓存穿透和雪崩
服务的高可用问题!
在这里我们不会详细的区分析解决方案的底层!
Redis 缓存的使用,极大的提升了应用程序的性能和效率,特别是数据查询方面。但同时,它也带来了一 些问题。其中,最要害的问题,就是数据的一致性问题,从严格意义上讲,这个问题无解。如果对数据的一致性要求很高,那么就不能使用缓存。
另外的一些典型问题就是,缓存穿透、缓存雪崩和缓存击穿。目前,业界也都有比较流行的解决方案。
缓存穿透(查不到)
概念
缓存穿透的概念很简单,用户想要查询一个数据,发现 redis 内存数据库没有,也就是缓存没有命中,于是向持久层数据库查询。发现也没有,于是本次查询失败。当用户很多的时候,缓存都没有命中(秒 杀!),于是都去请求了持久层数据库。这会给持久层数据库造成很大的压力,这时候就相当于出现了缓存穿透。
解决方案
布隆过滤器
布隆过滤器是一种数据结构,对所有可能查询的参数以 hash 形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力;
缓存空对象
当存储层不命中后,即使返回的空对象也将其缓存起来,同时会设置一个过期时间,之后再访问这个数据将会从缓存中获取,保护了后端数据源;
但是这种方法会存在两个问题:
1、如果空值能够被缓存起来,这就意味着缓存需要更多的空间存储更多的键,因为这当中可能会有很多 的空值的键;
2、即使对空值设置了过期时间,还是会存在缓存层和存储层的数据会有一段时间窗口的不一致,这对于 需要保持一致性的业务会有影响。
缓存击穿(量太大,缓存过期!)
概述
这里需要注意和缓存击穿的区别,缓存击穿,是指一个 key 非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个 key 在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一 个屏障上凿开了一个洞。
当某个 key 在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。
解决方案
设置热点数据永不过期
从缓存层面来看,没有设置过期时间,所以不会出现热点 key 过期后产生的问题。
加互斥锁
分布式锁:使用分布式锁,保证对于每个 key 同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩
概念
缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis 宕机~
产生雪崩的原因之一,比如在写本文的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商 品时间比较集中的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。
其实集中过期,倒不是非常致命,比较致命的缓存雪崩,是缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。
解决方案
redis 高可用
这个思想的含义是,既然 redis 有可能挂掉,那我多增设几台 redis,这样一台挂掉之后其他的还可以继续 工作,其实就是搭建的集群。(异地多活!)
限流降级
这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对 某个 key 只允许一个线程查询数据和写缓存,其他线程等待。
数据预热
数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数 据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的 key,设置不同的过期时间,让缓存失效的时间点尽量均匀。