ElasticSearch是非常重要的检索工具,利用分词、索引(倒排索引)、分词从众多检索工具中脱颖而出,本章是入门基础学习篇内容。
{
"_index" : ".kibana_1",
"_type" : "_doc",
"_id" : "space:default",
"_score" : 1.0,
"_source" : {
"space" : {
"name" : "默认值",
"description" : "这是您的默认空间!",
"color" : "#00bfb3",
"_reserved" : true
},
"type" : "space",
"references" : [ ],
"updated_at" : "2022-05-13T09:16:16.465Z"
}
}
//查看索引相关信息
GET kibana_sample_data_ecommerce
//查看索引的文档总数
GET kibana_sample_data_ecommerce/_count
//查看前10条文档,了解文档格式
POST kibana_sample_data_ecommerce/_search
{
}
//_cat indices API
//查看indices
GET /_cat/indices/kibana*?v&s=index
//查看状态为绿的索引
GET /_cat/indices?v&health=green
//按照文档个数排序
GET /_cat/indices?v&s=docs.count:desc
//查看具体的字段
GET /_cat/indices/kibana*?pri&v&h=health,index,pri,rep,docs.count,mt
//How much memory is used per index?
GET /_cat/indices?v&h=i,tm&s=tm:desc
-E cluster.name=stark
进行设定-E node.name=node1指定
{
"settings": {
"number_of_shards": 1,
"number_of_replicas": 1
}
}
1.使用PostMan创建一个名字叫stark的索引
http://127.0.0.1:9200/stark?pretty
// 返回值
{
"acknowledged": true,
"shards_acknowledged": true,
"index": "stark"
}
支持自动生成文档ID和指定文档ID两种方式:
POST /indexName/_doc
,系统会自动生成Document IDPUT /indexName/_create/ID
创建时,URI中显示指定_create
,此时如果该ID的文档已经存在,操作失败GET http://127.0.0.1:9200/IndexName/_doc/ID
PUT IndexName/_doc/1
{
"tags":["name","age","sex"]
}
Index和Create不一样的地方:如果文档存在,就索引新的文档。否则现有文档会被删除,新的文档被索引,版本信息(Version) + 1。
Update方法不会删除原来的文档,而是实现真正的数据更新,POST方法 ,Payload需要包含在doc中。
POST IndexNmae/_update/1
{
"doc":{
"albums":["aaa","bbb"]
}
}
DELETE IndexName/_doc/ID
Bulk Api 支持在一次Api调用中,对不同的索引进行操作,支持四种类型操作,Index\Create\Update\Delete。
可以在URI中指定Index,也可以在请求的Payload中进行,操作单挑操作失败,并不影响其他操作,返回结果包括了每一条操作执行的结果。
//对同一个索引进行操作
POST /IndexName/_doc/_bulk
//对不同的索引进行操作
POST _bulk
{ "index" : { "_index" : "test", "_id" : "1" } }
{ "field1" : "value1" }
{ "delete" : { "_index" : "test", "_id" : "2" } }
{ "create" : { "_index" : "test2", "_id" : "3" } }
{ "field1" : "value3" }
{ "update" : {"_id" : "1", "_index" : "test"} }
{ "doc" : {"field2" : "value2"} }
mGet批量操作,可以减少网络链接所产生的开销,提高性能。
#URI中指定index
GET /IndxName/_mget
{
"docs" : [
{
"_id" : "1"
},
{
"_id" : "2"
}
]
}
//对不同的索引进行操作
GET /_mget
{
"docs" : [
{
"_index" : "test",
"_id" : "1"
},
{
"_index" : "test",
"_id" : "2"
}
]
}
批量查询 msearch
// msearch 操作
POST kibana_sample_data_ecommerce/_msearch
{"query" : {"match_all" : {}},"size":1}
{"index" : "kibana_sample_data_flights"}
{"query" : {"match_all" : {}},"size":2}
倒排索引的核心组成
Es的倒排索引
1.指定查询的索引
集群上所有的索引:
GET /_search //集群上所有的索引
GET /Index1/_search //index1
GET /Index1,Index2/_search //index1和index2
GET /index*/_search //以index开头的索引
2.URI查询
用q表示查询内容,搜索叫做stark的客户GET /IndexName/_search?q=keyName:stark
3.Request Body
Request Body 支持 POST/GET两种方法,-H代表的是header参数 -d 代表的是body的请求参数。
curl -XGET "http://127.0.0.1:9200/IndexName/_search"
-H 'Content-Type:application/json'
-d
'
{
"query":{
"match_all":{}
}
}
'
4.搜索Response
搜索Response有几个关键的描述需要在这里解释一下:
q是关键字,df是指定字段,泛查询就是查询所有字段中包含关键字的结果
//指定字段
GET /IndexName/_search?q=2020&df=title
GET /IndexName/_search?q=title:2020
{
"profile":"true"
}
//泛查询
GET /IndexName/_search?q=2020
{
"profile":"true"
}
//分组,Bool查询
GET /IndexName/_search?q=title:(Hello World)
{
"profile":"true"
}
//泛查询
GET /IndexName/_search?q=title:Hello World
{
"profile":"true"
}
//检索title里有Hello ,没有World的词条
GET /IndexName/_search?q=title:(Hello NOT World)
{
"profile":"true"
}
//检索title里必须有Hello ,必须没有World的词条
GET /IndexName/_search?q=title:(+Hello -World)
{
"profile":"true"
}
URI Search支持范围查询和算术符号查询。
GET /IndexName/_search?q=year:>2020
{
"profile":"true"
}
通配符查询 、正则表达式 、模糊匹配与近似查询效率低,占用内存大,不建议使用,这部分大家有个了解就好。