Elasticsearch是一个实时分布式搜索和分析引擎。它让你以前所未有的速度处理大数据成为可能。
它用于全文搜索、结构或搜索、分析以及将这三者混合使用
搜索纠错、实时反馈
环境:
下载:https://www.elastic.co/cn/downloads/past-releases/elasticsearch-7-6-2
我们在windows下演示
ELK三剑客,解压即用:
bin 启动文件
config 配置文件
log4j2 日志配置文件
jvm.options java 虚拟机相关配置
elasticsearch.yml elasticsearch配置文件 默认9200端口!有跨域问题
lib 相关jar包
logs 日志
modules 功能模块
plugubs 插件 ik分词
启动:bin/elasticsearch.bat
访问测试http://127.0.0.1:9200/
{
"name" : "USERMIC-AQENDNF",
"cluster_name" : "elasticsearch",
"cluster_uuid" : "SgT0Xh5-QvCHBwjnrlMhOw",
"version" : {
"number" : "7.6.2",
"build_flavor" : "default",
"build_type" : "zip",
"build_hash" : "ef48eb35cf30adf4db14086e8aabd07ef6fb113f",
"build_date" : "2020-03-26T06:34:37.794943Z",
"build_snapshot" : false,
"lucene_version" : "8.4.0",
"minimum_wire_compatibility_version" : "6.8.0",
"minimum_index_compatibility_version" : "6.0.0-beta1"
},
"tagline" : "You Know, for Search"
}
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.15.2-linux-x86_64.tar.gz
https://github.com/mobz/elasticsearch-head
1、配置elasticsearch
解决跨域问题:elasticsearch-7.6.2\config\elasticsearch.yml
文件尾部添加如下代码
http.cors.enabled: true
http.cors.allow-origin: "*"
2、启动elasticsearch-head
docker build -t elk-head .
官网:https://www.elastic.co/cn/kibana/
Kibana版本要和ES一致
1、启动
http://localhost:5601
2、汉化
国际化文件x-pack\plugins\translations\translations\zh-CN.json
修改配置:config/``kibana.yml
116行
i18n.locale: "zh-CN"
docker命令:https://vitcloud.blog.csdn.net/article/details/122652560
下载:
https://github.com/deviantony/docker-elk/tree/release-7.x
http://localhost:9200/
http://localhost:5601/
1. 启动
docker-compose up
默认用户名、密码user
: elastic
password
: changeme
2 为内置用户初始化密码
docker-compose exec -T elasticsearch bin/elasticsearch-setup-passwords auto --batch
Changed password for user apm_system
PASSWORD apm_system = 40iHqszWXZuBHJUAO2rO
Changed password for user kibana_system
PASSWORD kibana_system = Mld3fRmxEmJy5mLwhbc2
Changed password for user kibana
PASSWORD kibana = Mld3fRmxEmJy5mLwhbc2
Changed password for user logstash_system
PASSWORD logstash_system = FEwag4dLfVJS6cVVZemn
Changed password for user beats_system
PASSWORD beats_system = S6L29ErIA3jigEQLTvnW
Changed password for user remote_monitoring_user
PASSWORD remote_monitoring_user = 7zWztQAFCoWytAA9VCDm
Changed password for user elastic
PASSWORD elastic = EtWvHc8lGh05YS7vS1mq
3 取消设置引导密码(可选)
docker-compose.yml
ELASTIC_PASSWORD
4 替换密码kibana/config/kibana.yml
elasticsearch.username: elastic
elasticsearch.password: EtWvHc8lGh05YS7vS1mq
logstash/config/logstash.yml
xpack.monitoring.elasticsearch.username: elastic
xpack.monitoring.elasticsearch.password: EtWvHc8lGh05YS7vS1mq
logstash/pipeline/logstash.conf
output {
elasticsearch {
hosts => "elasticsearch:9200"
user => "elastic"
password => "EtWvHc8lGh05YS7vS1mq"
ecs_compatibility => disabled
}
}
重启服务
docker-compose restart kibana logstash
1. 命令安装
在Dockerfile添加下面格式命令
RUN elasticsearch-plugin install analysis-icu
2. 手动安装
进入容器
docker exec -it e40bd5ee5f42 /bin/bash
宿主机解压好后,想容器复制插件
docker cp /usr/local/ik/ 容器名:/usr/share/elasticsearch/plugins
docker cp /usr/local/ik/ docker-elk_elasticsearch_1:/usr/share/elasticsearch/plugins
重启容器
docker restart 41e4c48f216c
集群、节点、索引、类型、文档、分片、映射是什么?
elesticsearch是面向文档,关系行数据库和delecticsearch客观的对比
Relation DB | Elasticsearch |
---|---|
数据库 | 索引(indices) |
表(tables) | types(逐渐弃用) |
行(rows) | documents |
字段(columns) | fields |
物理设计:
eleasticsearch在后台把每个索引分成多个分片,每分分片可以在集群中的不同服务器间迁移
文档
elasticsearch是面向文档的,name就意味着索引和搜索数据的做小单位是文档,在elasticsearch中,文档有以下几个重要属性。
name: string test
birt: date
索引
就是数据库
一个集群至少有一个节点,而一个节点就是一个elasticsearch进程,节点可以有多个索引
如果创建索引,那么有5个分片(primary shard,又称主分片)构成的,每一个主分片会有一个副本(replic shard, 又称复制分片)
一个分片是一个Lucene索引
倒排索引
elesticsearch使用的是一种称为倒排索引的机构,采用Lucene倒排索作为底层。这种结构适用于快速的全文搜索,一个索引由文档中所有不重复的列表构成,对于每一个次,都有一个包含它的文档列表。
例如,现有两个文档,每个文档包含如下内容:
study every day, good good up to forever # 文档1
Tto forever, study erery day # 文档2
如果要搜索含有python标签的文章,那相对于查找的所有原始数据而言,查找倒排
什么事IK分词器?
分词:即把一段中文或者别的划分成一个个关键字,我们在搜索时候会把自己的信息进行分词,会把数据库中的数据进行分词,然后进行一个匹配操作,默认的中文分词是将每个字看成一个词。
IK提供了两个分词算法:ik_smart和ik_max_word,其中ik_smart为最少的切分,ik_max_word为最细力度划分。
1. 安装
注意版本
https://github.com/medcl/elasticsearch-analysis-ik
查看已加载的插件elasticsearch-plugin.bat
elasticsearch-plugin list
# 最少切分
GET _analyze
{
"analyzer": "ik_smart",
"text": "人民教育出版社"
}
# 最细力度划分:可能所有组合
GET _analyze
{
"analyzer": "ik_max_word",
"text": "人民教育出版社"
}
elasticsearch-analysis-ik-7.17.0confi/IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">my.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
my.dic
有勇气的牛排
重启
docker restart 41e4c48f216c
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://vitcloud.blog.csdn.net/article/details/123024939
内容来源于网络,如有侵权,请联系作者删除!