MongoDB 固定集合(Capped Collections)
MongoDB 固定集合(Capped Collections)是性能出色且有着固定大小的集合
因为大小固定,我们可以想象其就像一个环形队列,当集合空间用完后,再插入的元素就会覆盖最初始的头部的元素
Capped collections 有很高的性能以及队列过期的特性(过期按照插入的顺序),这个有点和 "RRD" 概念类似
Capped collections 它非常适合类似记录日志的功能
创建固定集合
使用 createCollection 可以创建一个固定集合,但要设置 capped 属性设置为 true
> db.createCollection("mycapped_log",{capped:true,size:10000}) { "ok" : 1 }
还可以指定文档个数,加上 max:1000 属性
> db.createCollection("mycapped_log",{capped:true,size:10000,max:1000}) { "ok" : 1 }
判断集合是否为固定集合:
> db.mycapped_log.isCapped() true
可以使用以下命令将已存在的集合转换为固定集合
> db.runCommand({"convertToCapped":"language",size:10000}) { "ok" : 1 }
上面的命令将已存在的 language 集合转换为固定集合
固定集合查询
因为固定集合文档按照插入顺序储存的,所以默认情况下查询就是按照插入顺序返回的
但我们也可以使用 $natural 调整返回顺序
> db.capped_Log.find().sort({$natural:-1})
固定集合的特点
固定集合可以插入及更新,但更新不能超出 collection 的大小,否则更新失败
固定集合不允许删除,但是可以调用 drop() 删除集合中的所有行,但是 drop 后需要显式地重建集合
在 32 位机子上一个 cappped collection 的最大值约为 482.5M,64 位上只受系统文件大小的限制
固定集合属性
- 对固定集合进行插入速度极快
- 按照插入顺序的查询输出速度极快
- 能够在插入最新数据时,淘汰最早的数据
固定集合用法
- 储存日志信息
- 缓存一些少量的文档
Sharding
Capped collections 还不支持数据切分
使用和约束
在capped collection中,你能添加新的对象
能进行更新,然而,对象不会增加存储空间。如果增加,更新就会失败 。
数据库不允许进行删除。使用drop()方法删除collection所有的行。
注意: 删除之后,你必须显式的重新创建这个collection。
在32bit机器中,capped collection最大存储为1e9个字节
特性
-
如果空间都被使用完毕,新添加的对象会取代最旧的那个数据
-
如果你执行find(),并没有指定顺序。返回的结果就是按照插入顺序排序
-
倒序使用 find().sort({$natural:-1})
应用
- 日志Logging. Capped collection性能非常优秀,可以来存储日志文档。
- 插入一个没有索引的capped collection速度非常接近存储在文件系统。
- 额外的忧郁使用了内置的LRU机制,也不用担心超出硬盘空间。
- 缓存Caching. 如果你希望在数据库缓存一些小数量的对象。
- capped collection提供了非常方便的机制来实现这个操作。
- 注意的是要给capped table添加索引,因为这种应用,读频率高于写。
- 自动存档Auto Archiving. 如果你希望数据自动过期。
- capped collection要比手写cron scripts更为方便。
建议
为了最大化性能,不要再capped collection上创建索引
如果这个collection写操作多于读操作,更不需要索引了
注意的是,你可能创建了索引。速度就会降低,但是还是要比标准的 collection 要快
使用 natural ordering 来更有效的获取最近插入的元素,和 linux的 tail 命令相似