当前位置:   article > 正文

ELK日志分析

elk日志

目录

 

一、ELK概述

1、elk日志分析系统

2、ELK日志处理特点

3、Elasticsearch概述

4、LogStash概述

5、Kibana概述

二、部署ELK日志分析系统

1、环境配置

2、环境准备

3、部署 Elasticsearch 软件

4、安装 Elasticsearch-head 插件

5、ELK Logstash 部署(在 Apache 节点上操作)

6、ELK Kiabana 部署(在 Node1 节点上操作)


一、ELK概述

1、ELK日志分析系统

ELK是由Elasticsearch、Logstash、Kiban三个开源软件的组合。在实时数据检索和分析场合,三者通常是配合共用,而且又都先后归于 Elastic.co 公司名下,故有此简称。

2、ELK日志处理特点

一个完整的集中式日志系统,需要包含以下几个主要特点:

(1)收集-能够采集多种来源的日志数据——将日志进行集中化管理(beats)
(2)传输-能够稳定的把日志数据传输到中央系统——将日志格式化(Logstash),然后将格式化后的数据输出到Elasticsearch
(3)存储-如何存储日志数据——对格式化后的数据进行索引和存储(Elasticsearch)
(4)分析-可以支持 UI 分析——前端数据的展示(Kibana)

  (5)警告-能够提供错误报告,监控机制

3、Elasticsearch概述

Elasticsearch是一个基于Lucene的搜索服务器。它基于RESTful web接口提供了一个分布式多用户能力的全文搜索引擎。
Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是第二流行的企业搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
 

(1)Elasticsearch的特性

接近实时的搜索
集群
节点
索引
索引(库)→类型(表)→文档(记录)
分片和副本

(2)分片和副本

在上述特性中,最重要的就是分片和副本,也是让es数据库(Elasticsearch)成为百度这些主流搜索引擎的主要原因,理论上能提升4倍的性能。
结合实际情况分析:索引存储的数据可能超过单个节点的硬件限制,如一个10亿文档需1TB空间可能不适合存储在单个节点的磁盘上,或者从单个节点搜索请求太慢了,为了解决这个问题,elasticsearch提供将索引分成多个分片的功能,当在创建索引时,可以定义想要分片的数量。每个分片就是一个全功能的独立索引,可以位于集群中任何节点上。

分片的特点:
水平分割扩展,增大存储量
分布式并行跨分片操作,提供性能和吞吐量
分布式分片的机制和搜索请求的文档如何汇总完全是有elasticsearch控制的,这些对用户而言是透明的

网络问题等等其他问题可以在任何时候不期而至,为了健壮性,强烈建议要有个故障切换机制,无论何种故障以防止分片或者节点不可用,为此,elasticsearch让我们将索引分片复制一份或多份,称为分片副本或副本

副本的特点:
高可用性,以应对分片或者节点故障,出于这个原因,分片副本要在不同的节点上
性能加强,增加吞吐量,搜索可以并行在所有副本上执行
 

4、LogStash概述

一款强大的数据处理工具
可实现数据传输、格式处理、格式化输出
数据输入、数据加工(如过滤,改写等)以及数据输出
常用插件:Input、Filter Plugin、Output

Input:收集源数据(访问日志、错误日志等)
Filter Plugin:用于过滤日志和格式处理
Output:输出日志

5、Kibana概述

一个针对Elasticsearch的开源分析及可视化平台
搜索、查看存储在Elasticsearch索引中的数据
通过各种图表进行高级数据分析及展示
Kibana主要功能

(1)Elasticsearch无缝之集成
Kibana架构为Elasticsearch定制,可以将任何结构化和非结构化数据加入Elasticsearch索引。Kibana还充分利用了Elasticsearch强大的搜索和分析功能。
(2)整合数据
Kibana能够更好地处理海量数据,并据此创建柱形图、折线图、散点图、直方图、饼图和地图。
(3)复杂数据分析
Kibana提升了Elasticsearch分析能力,能够更加智能地分析数据,执行数学转换并且根据要求对数据切割分块。
(4)让更多团队成员收益
强大的数据库可视化接口让各业务岗位都能够从数据集合受益。
(5)接口灵活,分享更容易
使用Kibana可以更加方便地创建、保存、分享数据,并将可视化数据快速交流。
(6)配置简单
Kibana的配置和启用非常简单,用户体验非常友好。Kibana自带Web服务器,可以快速启动运行。
(7)可视化多数据源
Kibana可以非常方便地把来自Logstash、ES-Hadoop、Beats或第三方技术的数据整合到Elasticsearch,支持的第三方技术包括Apache flume、 Fluentd 等。
(8)简单数据导出
Kibana可以方便地导出感兴趣的数据,与其它数据集合并融合后快速建模分析,发现新结果。
 

二、部署ELK日志分析系统

1、环境配置

(1)node1

CentOS7.4(64 位) 192.168.222.10Elasticsearch 、 Kibana2核4G

(2)node2

CentOS7.4(64 位) 192.168.222.100Elasticsearch2核4G

(3)Apache

CentOS7.4(64 位) 192.168.222.20Logstash Apache2核4G

2、环境准备

  1. 1、更改主机名
  2. Node1节点:hostnamectl set-hostname node1
  3. Node2节点:hostnamectl set-hostname node2
  4. 2、配置域名解析
  5. vim /etc/hosts
  6. 192.168.222.10 node1
  7. 192.168.222.100 node2
  8. 3、查看Java环境,如果没有安装,yum -y install java
  9. java -version

 

3、部署 Elasticsearch 软件

  1. 1)#上传elasticsearch-5.5.0.rpm到/opt目录下
  2. cd /opt
  3. rpm -ivh elasticsearch-5.5.0.rpm
  4. 2)#加载系统服务
  5. systemctl daemon-reload
  6. systemctl enable elasticsearch.service
  7. 3)#修改elasticsearch主配置文件
  8. cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak
  9. vim /etc/elasticsearch/elasticsearch.yml
  10. --17--取消注释,指定集群名字
  11. cluster.name: my-elk-cluster
  12. --23--取消注释,指定节点名字:Node1节点为node1,Node2节点为node2
  13. node.name: node1
  14. --33--取消注释,指定数据存放路径
  15. path.data: /data/elk_data
  16. --37--取消注释,指定日志存放路径
  17. path.logs: /var/log/elasticsearch/
  18. --43--取消注释,改为在启动的时候不锁定内存
  19. bootstrap.memory_lock: false
  20. --55--取消注释,设置监听地址,0.0.0.0代表所有地址
  21. network.host: 0.0.0.0
  22. --59--取消注释,ES 服务的默认监听端口为9200
  23. http.port: 9200
  24. --68--取消注释,集群发现通过单播实现,指定要发现的节点 node1、node2
  25. discovery.zen.ping.unicast.hosts: ["node1", "node2"]
  26. #查看主配置文件
  27. grep -v "^#" /etc/elasticsearch/elasticsearch.yml
  28. #将node1的配置文件拷贝一份在node2上并去node2上修改
  29. scp /etc/elasticsearch/elasticsearch.yml node2:/etc/elasticsearch/
  30. vim /etc/elasticsearch/elasticsearch.yml
  31. --23--取消注释,指定节点名字:Node1节点为node1,Node2节点为node2
  32. node.name: node2
  33. 4)#创建数据存放路径并授权
  34. mkdir -p /data/elk_data
  35. chown elasticsearch:elasticsearch /data/elk_data/
  36. 5)#启动elasticsearch是否成功开启
  37. systemctl start elasticsearch.service
  38. netstat -antp | grep 9200
  39. 6)#查看节点信息
  40. 浏览器访问 ,查看节点 Node1、Node2 的信息
  41. http://192.168.222.10:9200 http://192.168.222.100:9200
  42. #原谅色:green
  43. http://192.168.222.10:9200/_cluster/health?pretty
  44. http://192.168.222.100:9200/_cluster/health?pretty
  45. ####### 使用以上方式查看状态并不友好,可以通过 elasticsearch-head插件来直接管理 #####

 

 

 

 

 4、安装 Elasticsearch-head 插件

  1. 1)#编译安装 node
  2. #上传软件包 node-v8.2.1.tar.gz 到/opt
  3. yum install gcc gcc-c++ make -y
  4. cd /opt
  5. tar zxvf node-v8.2.1.tar.gz
  6. cd node-v8.2.1/
  7. ./configure
  8. make -j2 && make install
  9. 2)#安装 phantomjs
  10. #上传软件包 phantomjs-2.1.1-linux-x86_64.tar.bz2
  11. cd /opt
  12. tar jxvf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/src/
  13. cd /usr/local/src/phantomjs-2.1.1-linux-x86_64/bin
  14. cp phantomjs /usr/local/bin
  15. 3)#安装 Elasticsearch-head 数据可视化工具
  16. #上传软件包 elasticsearch-head.tar.gz 到/opt
  17. cd /opt
  18. tar zxvf elasticsearch-head.tar.gz -C /usr/local/src/
  19. cd /usr/local/src/elasticsearch-head/
  20. npm install
  21. 4)#修改 Elasticsearch 主配置文件
  22. vim /etc/elasticsearch/elasticsearch.yml
  23. ......
  24. --末尾添加以下内容--
  25. http.cors.enabled: true #开启跨域访问支持,默认为 false
  26. http.cors.allow-origin: "*" #指定跨域访问允许的域名地址为所有
  27. systemctl restart elasticsearch
  28. 5)#启动 elasticsearch-head 服务
  29. #必须在解压后的 elasticsearch-head 目录下启动服务,进程会读取该目录下的 gruntfile.js 文件,否则可能启动失败。
  30. cd /usr/local/src/elasticsearch-head/
  31. npm run start &
  32. > elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
  33. > grunt server
  34. Running "connect:server" (connect) task
  35. Waiting forever...
  36. Started connect web server on http://localhost:9100
  37. #elasticsearch-head 监听的端口是 9100
  38. netstat -natp |grep 9100
  39. 6)#通过 Elasticsearch-head 查看 Elasticsearch 信息通过浏览器访问 http://192.168.59.115:9100/ 地址并连接群集。如果看到群集健康值为 green 绿色,代表群集很健康。访问有问题 可以将localhost 改成ip地址
  40. 7)#插入索引
  41. ##登录192.168.59.115 node1主机##### 索引为index-demo,类型为test,可以看到成功创建
  42. [root@node1 ~]# curl -X PUT 'localhost:9200/index-demo/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'
  43. {
  44. "_index" : "index-demo",
  45. "_type" : "test",
  46. "_id" : "1",
  47. "_version" : 1,
  48. "result" : "created",
  49. "_shards" : {
  50. "total" : 2,
  51. "successful" : 2,
  52. "failed" : 0
  53. },
  54. "created" : true
  55. }
  56. ####在192.168.91.100 刷新浏览器输入看索引信息###
  57. node1信息动作 01234
  58. node2信息动作 01234
  59. ●上面图可以看见索引默认被分片5个,并且有一个副本
  60. 点击数据浏览--会发现在node1上创建的索引为index-demo,类型为test, 相关的信息

 

 

 

 

 4、ELK Logstash 部署(在 Apache 节点上操作)

(1)安装Logstash

  1. 1)#修改主机名
  2. hostnamectl set-hostname apache
  3. su
  4. 2)#安装httpd并启动
  5. yum -y install httpd
  6. systemctl start httpd
  7. 3)#安装java环境
  8. yum -y install java
  9. java -version
  10. 4)#安装logstash
  11. cd /opt
  12. rpm -ivh logstash-5.5.1.rpm
  13. systemctl start logstash.service
  14. systemctl enable logstash.service
  15. cd /usr/share/logstash/
  16. ls
  17. ln -s /usr/share/logstash/bin/logstash /usr/local/bin/

 

(2)测试 Logstash(Apache)与elasticsearch(node)功能是否正常,做对接 

  1. Logstash这个命令测试
  2. 字段描述解释:
  3. ● -f 通过这个选项可以指定logstash的配置文件,根据配置文件配置logstash
  4. ● -e 后面跟着字符串 该字符串可以被当做logstash的配置(如果是“空”则默认使用stdin做为输入、stdout作为输出)
  5. ● -t 测试配置文件是否正确,然后退出
  6. logstash -f 配置文件名字 去连接elasticsearch
  7. 1)#输入采用标准输入 输出采用标准输出---登录192.168.59.115 在Apache服务器上
  8. logstash -e 'input { stdin{} } output { stdout{} }'
  9. 16:45:21.422 [[main]-pipeline-manager] INFO logstash.pipeline - Pipeline main started
  10. 16:45:21.645 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9600}
  11. www.baidu.com ##需要手动输入
  12. 2021-12-16T08:46:14.041Z apache www.baidu.com
  13. www.sina.com ##需要手动输入
  14. 2021-12-16T08:46:23.548Z apache www.sina.com
  15. 2)#使用 rubydebug 输出详细格式显示,codec 为一种编解码器
  16. logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'
  17. 16:51:13.127 [[main]-pipeline-manager] INFO logstash.pipeline - Starting pipeline {"id"=>"main", "pipeline.workers"=>2, "pipeline.batch.size"=>125, "pipeline.batch.delay"=>5, "pipeline.max_inflight"=>250}
  18. 16:51:13.174 [[main]-pipeline-manager] INFO logstash.pipeline - Pipeline main started
  19. The stdin plugin is now waiting for input:
  20. 16:51:13.205 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9600}
  21. www.baidu.com ##需要手动输入
  22. {
  23. "@timestamp" => 2021-12-16T08:52:22.528Z,
  24. "@version" => "1",
  25. "host" => "apache",
  26. "message" => "www.baidu.com"
  27. }
  28. 3)##使用logstash将信息写入elasticsearch中
  29. logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.222.10:9200"] } }'

 

 

(3) 定义 logstash配置文件

  1. chmod o+r /var/log/messages
  2. ll /var/log/messages
  3. vim /etc/logstash/conf.d/system.conf
  4. input {
  5. file{
  6. path => "/var/log/messages"
  7. type => "system"
  8. start_position => "beginning"
  9. }
  10. }
  11. output {
  12. elasticsearch {
  13. hosts => ["192.168.222.10:9200"]
  14. index => "system-%{+YYYY.MM.dd}"
  15. }
  16. }
  17. systemctl restart logstash.service

 6、ELK Kiabana 部署(在 Node1 节点上操作)

  1. 1)#安装 Kiabana
  2. #上传软件包 kibana-5.5.1-x86_64.rpm 到/opt目录
  3. cd /opt
  4. rpm -ivh kibana-5.5.1-x86_64.rpm
  5. 2)#设置 Kibana 的主配置文件
  6. vim /etc/kibana/kibana.yml
  7. --2--取消注释,Kiabana 服务的默认监听端口为5601
  8. server.port: 5601
  9. --7--取消注释,设置 Kiabana 的监听地址,0.0.0.0代表所有地址
  10. server.host: "0.0.0.0"
  11. --21--取消注释,设置和 Elasticsearch 建立连接的地址和端口
  12. elasticsearch.url: "http://192.168.222.10:9200"
  13. --30--取消注释,设置在 elasticsearch 中添加.kibana索引
  14. kibana.index: ".kibana"
  15. 3)#启动 Kibana 服务
  16. systemctl start kibana.service
  17. systemctl enable kibana.service
  18. netstat -natp | grep 5601
  19. 4)#验证 Kibana
  20. 浏览器访问 http://192.168.222.10:5601
  21. 第一次登录需要添加一个 Elasticsearch 索引:
  22. Index name or pattern
  23. //输入:system-* #在索引名中输入之前配置的 Output 前缀“system”
  24. 单击 “create” 按钮创建,单击 “Discover” 按钮可查看图表信息及日志信息。
  25. 数据展示可以分类显示,在“Available Fields”中的“host”,然后单击 “add”按钮,可以看到按照“host”筛选后的结果
  26. 5)#将 Apache 服务器的日志(访问的、错误的)添加到 Elasticsearch 并通过 Kibana 显示
  27. vim /etc/logstash/conf.d/apache_log.conf
  28. input {
  29. file{
  30. path => "/etc/httpd/logs/access_log"
  31. type => "access"
  32. start_position => "beginning"
  33. }
  34. file{
  35. path => "/etc/httpd/logs/error_log"
  36. type => "error"
  37. start_position => "beginning"
  38. }
  39. }
  40. output {
  41. if [type] == "access" {
  42. elasticsearch {
  43. hosts => ["192.168.222.10:9200"]
  44. index => "apache_access-%{+YYYY.MM.dd}"
  45. }
  46. }
  47. if [type] == "error" {
  48. elasticsearch {
  49. hosts => ["192.168.222.10:9200"]
  50. index => "apache_error-%{+YYYY.MM.dd}"
  51. }
  52. }
  53. cd /etc/logstash/conf.d/
  54. /usr/share/logstash/bin/logstash -f apache_log.conf
  55. 6.#浏览器访问http://192.168.59.115:9100/测试,查看索引信息能发现
  56. apache_error-2019.04.16 apache_access-2019.04.16
  57. #浏览器访问http://192.168.59.115:5601
  58. 点击左下角有个management选项---index patterns---create index pattern
  59. ----分别创建apache_error-* 和 apache_access-* 的索引

 

 

 

 

 

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/442381
推荐阅读
相关标签
  

闽ICP备14008679号