MongDB做为一款由 C++编写的非关系型数据库(NoSql),却有着最接近 SQL型数据库的功能,使用成本比 SQL型数据库低,做为评论系统来使用非常不错
一、MongoDB简介
1.文章评论数据分析
- 数据量大
- 写入操作频繁
- 价值较低(评论数据丢失不会有什么太大影响)
对于这样的数据,我们更适合使用MongoDB来实现数据的存储,如果使用mysql来存储成本太高
2.什么是MongoDB
- MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应
用提供可扩展的高性能数据存储解决方案 - MongoDB是一个介于关系数据库和非关系数据库之间的产品(自身是非关系型数据库NoSql),是非关系数据库当中功能最丰富,最像关系数据库的
- 它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型
3.MongoDB特点
Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的
查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对
数据建立索引
它的特点是高性能、易部署、易使用,存储数据非常方便,主要功能特性有:
- 面向集合存储,易存储对象类型的数据
- 模式自由
- 支持动态查询
- 支持完全索引,包含内部对象
- 支持查询
- 支持复制和故障恢复
- 使用高效的二进制数据存储,包括大型对象(如视频等)
- 自动处理碎片,以支持云计算层次的扩展性
- 支持RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言
- 文件存储格式为BSON(一种JSON的扩展)
4.MongoDB体系结构
文档(document)、集合(collection)、数据库(database)三部分组成
- MongoDB 的文档(document),相当于关系数据库中的一行记录
- 多个文档组成一个集合(collection),相当于关系数据库的表
- 多个集合(collection),逻辑上组织在一起,就是数据库(database)
一个 MongoDB 实例支持多个数据库(database)
对照表:
MongoDB体系结构 | MySql体系结构 |
---|---|
数据库(databases) | 数据库(databases) |
集合(collections) | 表(table) |
文档(document) | 行(row) |
5.MongoDB数据类型
数据类型 | 描述 |
---|---|
String | 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。 |
Integer | 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。 |
Boolean | 布尔值。用于存储布尔值(真/假)。 |
Double | 双精度浮点值。用于存储浮点值。 |
Array | 用于将数组或列表或多个值存储为一个键。 |
Timestamp | 时间戳。记录文档修改或添加的具体时间。 |
Object | 用于内嵌文档。 |
Null | 用于创建空值。 |
Date | 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。 |
Object ID | 对象 ID。用于创建文档的 ID。 |
Binary Data | 二进制数据。用于存储二进制数据。 |
Code | 代码类型。用于在文档中存储 JavaScript 代码。 |
Regular expression | 正则表达式类型。用于存储正则表达式。 |
ObjectId
ObjectId 类似唯一主键(不指定,会自动生成),可以很快的去生成和排序,包含 12 bytes,含义是:
- 前 4 个字节表示创建 unix 时间戳,格林尼治时间 UTC 时间,比北京时间晚了 8 个小时
- 接下来的 3 个字节是机器标识码
- 紧接的两个字节由进程 id 组成 PID
- 最后三个字节是随机数
MongoDB 中存储的文档必须有一个 _id 键。这个键的值可以是任何类型的,默认是个 ObjectId 对象
时间戳
BSON 有一个特殊的时间戳类型,与普通的日期类型不相关。时间戳值是一个 64 位的值。其中:
- 前32位是一个 time_t 值【与Unix新纪元(1970年1月1日)相差的秒数】
- 后32位是在某秒中操作的一个递增的序数
在单个 mongod 实例中,时间戳值通常是唯一的
日期
表示当前距离 Unix新纪元(1970年1月1日)的毫秒数。日期类型是有符号的, 负数表示 1970 年之前的日期
二、MongoDB常用命令
1.选择和创建数据库
选择和创建数据库的语法格式:
1 | use 数据库名称 |
- 如果数据库存在则选择该数据库,如果数据库不存在则自动创建。以下语句创建commentdb数据库:
1 | use commentdb |
查看数据库:
1 | show dbs |
查看集合:
- 需要先选择数据库之后,才能查看该数据库的集合
1 | show collections |
2.插入与查询文档
选择数据库后,使用集合来对文档进行操作,插入文档语法格式:
1 | db.集合名称.insert(数据); |
- 插入以下测试数据:
1 | db.comment.insert({content:"十次方课程",userid:"1011"}) |
查询集合的语法格式:
1 | db.集合名称.find() |
- 查询comment集合的所有文档,输入以下命令:
1 | db.comment.find() |
发现文档会有一个叫_id的字段,这个相当于我们原来关系数据库中表的主键,当你在插入文档记录时没有指定该字段,MongoDB会自动创建,其类型是ObjectID类型。如果我们在插入文档记录时指定该字段也可以,其类型可以是ObjectID类型,也可以是MongoDB支持的任意类型
输入以下测试语句:
1 | db.comment.insert({_id:"1",content:"到底为啥出错",userid:"1012",thumbup:2020}); |
按一定条件来查询,比如查询userid为1013的记录,只要在find()中添加参数即可,参数也是json格式,如下:
1 | db.comment.find({userid:'1013'}) |
只需要返回符合条件的第一条数据,我们可以使用findOne命令来实现:
1 | db.comment.findOne({userid:'1013'}) |
返回指定条数的记录,可以在find方法后调用limit来返回结果,例如:
1 | db.comment.find().limit(2) |
3.修改与删除文档
修改文档的语法结构:
1 | db.集合名称.update(条件,修改后的数据) |
- 修改_id为1的记录,点赞数为1000,输入以下语句:
1 | db.comment.update({_id:"1"},{thumbup:1000}) |
执行后发现,这条文档除了thumbup字段其它字段都不见了
为了解决这个问题,我们需要使用修改器$set来实现,命令如下:
1 | db.comment.update({_id:"2"},{$set:{thumbup:2000}}) |
删除文档的语法结构:
1 | db.集合名称.remove(条件) |
- 以下语句可以将数据全部删除,慎用~
1 | db.comment.remove({}) |
- 删除条件可以放到大括号中,例如删除thumbup为1000的数据,输入以下语句:
1 | db.comment.remove({thumbup:1000}) |
4.统计条数
统计记录条件使用count()方法。以下语句统计comment集合的记录数:
1 | db.comment.count() |
- 按条件统计 ,例如统计userid为1013的记录条数:
1 | db.comment.count({userid:"1013"}) |
5.模糊查询
MongoDB的模糊查询是通过正则表达式的方式实现的:
1 | /模糊查询字符串/ |
- 查询评论内容包含“流量”的所有文档,代码如下:
1 | db.comment.find({content:/流量/}) |
- 查询评论内容中以“加班”开头的,代码如下:
1 | db.comment.find({content:/^加班/}) |
6.大于 小于 不等于
<, <=, >, >= 这个操作符也是很常用的,格式如下:
1 | db.集合名称.find({ "field" : { $gt: value }}) // 大于: field > value |
- 查询评论点赞数大于1000的记录:
1 | db.comment.find({thumbup:{$gt:1000}}) |
7.包含与不包含
包含使用$in操作符
- 查询评论集合中userid字段包含1013和1014的文档:
1 | db.comment.find({userid:{$in:["1013","1014"]}}) |
不包含使用$nin操作符
- 查询评论集合中userid字段不包含1013和1014的文档:
1 | db.comment.find({userid:{$nin:["1013","1014"]}}) |
8.条件连接
查询同时满足两个以上条件,需要使用$and操作符将条件进行关联(相当于SQL的and)。格式为:
1 | and:[ {条件},{条件},{条件} ] |
- 查询评论集合中thumbup大于等于1000 并且小于2000的文档:
1 | db.comment.find({$and:[ {thumbup:{$gte:1000}} ,{thumbup:{$lt:2000} }]}) |
如果两个以上条件之间是或者的关系,使用操作符进行关联,与前面and的使用方式相同,格式为:
1 | or:[ {条件},{条件},{条件} ] |
- 查询评论集合中userid为1013,或者点赞数小于2000的文档记录:
1 | db.comment.find({$or:[ {userid:"1013"} ,{thumbup:{$lt:2000} }]}) |
9.列值增长
对某列值在原有值的基础上进行增加或减少,可以使用$inc运算符:
- 正数增加
1 | db.comment.update({_id:"2"},{$inc:{thumbup:1}}) |
- 负数减少
1 | db.comment.update({_id:"2"},{$inc:{thumbup:-2}}) |