logstash grok filter kvpattern

shannon. 2023. 3. 15. 16:57

official doc: https://www.elastic.co/guide/en/logstash/current/plugins-filters-grok.html


filter doc : https://www.elastic.co/guide/en/logstash/current/plugins-filters-json.html


if the target field already exists, it will be overwritten!


KV filter : https://www.elastic.co/guide/en/logstash/current/plugins-filters-kv.html


kv {
			  source => "msg02"
			  #field_split => ","
			  field_split_pattern => "\s|,+"
			  value_split => "="

내가 처리해야할 데이터의 Key value 형식이
"blah blah a=b, c=d" 이랬다.
공백도 split 단위이고 ,콤마로도 잘라야 해서 두개 다 써야할 때는 정규식 pattern을 적용하면 된다. 우선순위도 먹음. ( \s 또는 , ) +이건 반복 이라는 뜻

그 다음은 blah blah a:b, c:d  인데,,, kv 이중적용이 가능하려나

일단 kv filter  를 적용했더니 잘 처리된다. 성능은 dissect이 더 좋은 거 같지만 난 기능이 더 중요했다. 많은 종류의 로그를 한번에 처리해야해서.



logstash 필터 dissect 성능 테스트 | Popit

방화벽처럼 key-value 구조가 반복되는 로그의 필드 분류에는 kv 필터 가 딱이다. 특히 구분기호로 '='을 사용하는 key-value 구조는 kv {} 구문만으로도 완벽한 테이블 구조를 만들어 줌. 문제는 kv 필터




