黑马mongoDb
本文章主要对mongodb的快速操作进行讲解,不对深层次原理进行讲解
操作数据库
# 一.连接mongodb服务器
mongo --host=地址 --port=端口
# 二.常用的基本命令
# 1. 数据库
# ①创建数据库
use 数据库
use articledb
2
注意,只要在新建的库中实际上有操作了后,才会真正创建此数据库。
为什么呢?因为此时的库是创建在内存中的,而show dbs展示的是磁盘当中的库,只有我们在新建的库当中创建了新的文档后,才会持久化到磁盘。
没有则创建,有则使用
# ②展示数据库
show dbs //展示当前有哪些库
show databases
db //展示当前正在使用的库,默认在test库
2
3
4
默认的三个库有什么作用?
# ③删除数据库
db.dropDatabase() 删除当前库
主要是删除已经持久化的数据库
# 2. 集合collection
# ①创建
显示创建
db.creatCollection("名字")
隐式创建:向某一个集合中插入文档,集合存在则插入,不存在则创建一个集合并插入
# ②删除
db.集合名.drop();
# ③查询
查询当前数据库的集合
show collections
show tables
2
# 3.文档
文档的数据结构和JSON基本一样。所有存储在集合中的数据都是BSON格式。
# ①文档的插入(隐式创建集合)
db.collection.insert(
<document or array of documents>,
{
writeConcern: <document>,
ordered: <boolean>
}
)
2
3
4
5
6
7
db.集合名.insert({json格式})
单条数据插入例子:
要向comment的集合(表)中插入一条测试数据:
db.comment.insert({"articleid":"100000","content":"今天天气真好,阳光明 媚","userid":"1001","nickname":"Rose","createdatetime":new Date(),"likenum":NumberInt(10),"state":null})
1
2提示:
1)comment集合如果不存在,则会隐式创建
2)mongo中的数字,默认情况下是double类型,如果要存整型,必须使用函数NumberInt(整型数字),否则取出来就有问题了。
3)插入当前日期使用 new Date()
4)插入的数据没有指定 _id ,会自动生成主键值
5)如果某字段没值,可以赋值为null,或不写该字段
执行后,如下,说明插入一个数据成功了。
WriteResult({ "nInserted" : 1 })
1注意:
文档中的键/值对是有序的。
文档中的值不仅可以是在双引号里面的字符串,还可以是其他几种数据类型(甚至可以是整个嵌入的文档)。
MongoDB区分类型和大小写。
MongoDB的文档不能有重复的键。
文档的键是字符串。除了少数例外情况,键可以使用任意UTF-8字符。
db.集合名.insertMany('[{},{},{}]')
插入多条数据例子:
db.comment.insertMany([ {"_id":"1","articleid":"100001","content":"我们不应该把清晨浪费在手机上,健康很重要,一杯温水幸福你我 他。","userid":"1002","nickname":"相忘于江湖","createdatetime":new Date("2019-08- 05T22:08:15.522Z"),"likenum":NumberInt(1000),"state":"1"}, {"_id":"2","articleid":"100001","content":"我夏天空腹喝凉开水,冬天喝温开水","userid":"1005","nickname":"伊人憔 悴","createdatetime":new Date("2019-08-05T23:58:51.485Z"),"likenum":NumberInt(888),"state":"1"}, {"_id":"3","articleid":"100001","content":"我一直喝凉开水,冬天夏天都喝。","userid":"1004","nickname":"杰克船 长","createdatetime":new Date("2019-08-06T01:05:06.321Z"),"likenum":NumberInt(666),"state":"1"}, {"_id":"4","articleid":"100001","content":"专家说不能空腹吃饭,影响健康。","userid":"1003","nickname":"凯 撒","createdatetime":new Date("2019-08-06T08:18:35.288Z"),"likenum":NumberInt(2000),"state":"1"}, {"_id":"5","articleid":"100001","content":"研究表明,刚烧开的水千万不能喝,因为烫 嘴。","userid":"1003","nickname":"凯撒","createdatetime":new Date("2019-08- 06T11:01:02.521Z"),"likenum":NumberInt(3000),"state":"1"} ]);
1
2
3
4
5
6
7
8
9
10
11
12
13
14提示:
插入时指定了 _id ,则主键就是该值。
如果某条数据插入失败,将会终止插入,但已经插入成功的数据不会回滚掉。
因为批量插入由于数据较多容易出现失败,因此,可以使用try catch进行异常捕捉处理,测试的时候可以不处理。如(了解)
# ②文档的查询
基本语法:db.collection.find(<query>, [projection])
- 查询单个
db.集合名.find()
返回集合中所有数据
db.集合名.find(json) 根据具体条件进行查询 db.comment.find({userid:'1003'})
- 查询多个
db.集合名.findOne(json) 根据条件查询,并只返回一条数据
查询用户编号是1003的记录,但只最多返回符合条件的第一条记录:db.comment.findOne({userid:'1003'})
# ③投影查询
什么是投影查询,mongo数据查询默认会显示所有的数据,就像select * ,我们怎么指定想要显示的字段呢?
db.集合名.find({条件},{userid:1,_id:0})
这样,就仅仅会显示userid字段
# ④文档的更新
db.collection.updata(query,update,options)
语法:
主要关注前四个参数
- 覆盖修改:
如果我们想修改_id为1的记录,点赞量为1001,输入以下语句:
db.comment.update({_id:"1"},{likenum:NumberInt(1001)})
执行后,我们会发现,这条文档除了likenum字段其它字段都不见了
- 局部修改
为了解决这个问题,我们需要使用修改器$set来实现,命令如下:
我们想修改_id为2的记录,浏览量为889,输入以下语句:
db.comment.update({_id:"2"},{$set:{likenum:NumberInt(889)}})
- 批量修改
更新所有用户为 1003 的用户的昵称为 凯撒大帝 。
//默认只修改第一条数据
db.comment.update({userid:"1003"},{$set:{nickname:"凯撒2"}})
//修改所有符合条件的数据
db.comment.update({userid:"1003"},{$set:{nickname:"凯撒大帝"}},{multi:true})
2
3
4
提示:如果不加后面的参数,则只更新符合条件的第一条记录
- upsert
db.stu.update({"_id": 3}, {用于更新的文档内容}, “这里就是要添加的第三个参数,是固定的!”)
所以这个方法适用于:以更新条件为基础,如果查到对应数据,则将对应数据更新,如果查不到对应数据,那么则以更新条件新增一条数据! 优点: 设想,如果我们对某种数据操作都是先查数据库,确定是否有对应文档,再决定更新还是插入,那么在多个进程同时操作同一段代码,或者多个进程/线程操作同一个条件时,就会遇到同时对给定条件插入多个文档这样的竞态条件, 但是,使用upsert,既可以避免这种竞态问题,又可以减少代码量,并且这样会更高效,是原子性的
- 列值增长的修改
如果我们想实现对某列值在原有值的基础上进行增加或减少,可以使用 $inc 运算符来实现。
需求:对3号数据的点赞数,每次递增1
db.comment.update({_id:"3"},{$inc:{likenum:NumberInt(1)}})
# ⑤文档的删除
语法结构: db.集合名称.remove(条件)
db.comment.remove({_id:"1"})
如果删除全部:db.comment.remove({})
# 三. 分页查询
# ①数量查询
db.collection.count(query, options)
- 统计某集合中的所有记录
db.comment.count()
- 按照条件统计记录
db.comment.count({userid:"1003"})
# ②分页查询
可以使用limit()方法来读取指定数量的数据,使用skip()方法来跳过指定数量的数据。
>db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)
如果你想返回指定条数的记录,可以在fifind方法后调用limit来返回结果(TopN),默认值20,例如:db.comment.find().limit(3)
skip方法同样接受一个数字参数作为跳过的记录条数。(前N个不要),默认值是0
db.comment.find().skip(3)
上面两个语法组合到一起,就是分页查询
分页查询:需求:每页2个,第二页开始:跳过前两条数据,接着值显示3和4条数据
//第一页
db.comment.find().skip(0).limit(2)
//第二页
db.comment.find().skip(2).limit(2)
//第三页
db.comment.find().skip(4).limit(2)
2
3
4
5
6
# 四.排序查询
sort() 方法对数据进行排序,sort() 方法可以通过参数指定排序的字段,并使用 1 和 -1 来指定排序的方式,其中 1 为升序排列,而 -1 是用于降序排列。
语法如下所示:
db.COLLECTION_NAME.find().sort({KEY:1})
或
db.集合名称.find().sort(排序方式)
2
3
例如:
对userid降序排列,并对访问量进行升序排列db.comment.find().sort({userid:-1,likenum:1})
提示:
skip(), limilt(), sort()三个放在一起执行的时候,执行的顺序是先 sort(), 然后是 skip(),最后是显示的 limit(),和命令编写顺序无关
# 五.更多特殊
# 正则表达式
# 范围查询
# 包含查询
# 条件连接查询
常用命令总结:
# 六.索引
# 1.概述
索引支持在MongoDB中高效地执行查询。如果没有索引,MongoDB必须执行全集合扫描,即扫描集合中的每个文档,以选择与查询语句 匹配的文档。这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非 常致命的。
如果查询存在适当的索引,MongoDB可以使用该索引限制必须检查的文档数。 索引是特殊的数据结构,它以易于遍历的形式存储集合数据集的一小部分。索引存储特定字段或一组字段的值,按字段值排序。索引项的排
序支持有效的相等匹配和基于范围的查询操作。此外,MongoDB还可以使用索引中的排序返回排序结果。 官网文档:https://docs.mongodb.com/manual/indexes/ 了解: MongoDB索引使用B树数据结构(确切的说是B-Tree,MySQL是B+Tree)
# 2.索引类型
# 单字段索引
MongoDB支持在文档的单个字段上创建用户定义的升序/降序索引,称为单字段索引(Single Field Index)。 对于单个字段索引和排序操作,索引键的排序顺序(即升序或降序)并不重要,因为MongoDB可以在任何方向上遍历索引。
TODO:这里就和mysql不同了,mysql似乎只能默认升序排序,而且只能从一个方向遍历
答:gpt说到,mysql的索引是默认的升序,但是可以指定为降序
CREATE TABLE my_table ( id INT PRIMARY KEY, name VARCHAR(50), age INT, INDEX idx_name (name DESC) );
1
2
3
4
5
6
# 复合索引
MongoDB还支持多个字段的用户定义索引,即复合索引(Compound Index)。
复合索引中列出的字段顺序具有重要意义。例如,如果复合索引由{ userid: 1, score: -1 }组成,则索引首先按userid正序排序,然后 在每个userid的值内,再在按score倒序排序。
# 其他特殊索引
地理空间索引(Geospatial Index)、文本索引(Text Indexes)、哈希索引(Hashed Indexes)。
地理空间索引(Geospatial Index) 为了支持对地理空间坐标数据的有效查询,MongoDB提供了两种特殊的索引:返回结果时使用平面几何的二维索引和返回结果时使用球面几何的二维球面索引。
文本索引(Text Indexes)【建议使用更高效的文本索引lucence】
MongoDB提供了一种文本索引类型,支持在集合中搜索字符串内容。这些文本索引不存储特定于语言的停止词(例如“the”、“a”、“or”), 而将集合中的词作为词干,只存储根词。
【搭建集群时会自动使用hash索引】
哈希索引(Hashed Indexes) 为了支持基于散列的分片,MongoDB提供了散列索引类型,它对字段值的散列进行索引。这些索引在其范围内的值分布更加随机,但只支持相等匹配,不支持基于范围的查询。
# 3. 索引的基本操作
# 返回一个集合的所有索引
db.collection.getIndexs()
提示:该语法命令运行要求是MongoDB 3.0+
结果中显示的是默认 _id 索引。 默认_id索引:
MongoDB在创建集合的过程中,在 _id 字段上创建一个唯一的索引,默认名字为 id ,该索引可防止客户端插入两个具有相同值的文 档,您不能在_id字段上删除此索引。
注意:该索引是唯一索引,因此值不能重复,即 _id 值不能重复的。在分片集群中,通常使用 _id 作为片键。
# 索引的创建
db.collection.createIndex(keys, options)
注意在 3.0.0 版本前创建索引方法为 db.collection.ensureIndex() ,之后的版本使用了 db.collection.createIndex() 方法,
ensureIndex() 还能用,但只是 createIndex() 的别名。
示例1:创建单字段索引
示例2:创建复合索引
# 索引的移除
- 移除指定的索引
示例:
- 删除所有索引
db.collection.dropIndexes()
# 执行计划
可类比mysql的explain语句
分析查询性能(Analyze Query Performance)通常使用执行计划(解释计划、Explain Plan)来查看查询的情况,如查询耗费的时间、是 否基于索引查询等。那么,通常,我们想知道,建立的索引是否有效,效果如何,都需要通过执行计划查看。
db.collection.find(query,options).explain(options)
关注点在stage字段
# 覆盖的查询
和mysql的覆盖索引一样
当查询条件和查询的投影仅包含索引字段时,MongoDB直接从索引返回结果,而不扫描任何文档或将文档带入内存。 这些覆盖的查询可以 非常有效。
参考: