엘라스틱 기본 개념과 특징 : https://jaemunbro.medium.com/elastic-search-기초-스터디-ff01870094f0

엘라스틱 서치 공식문서 : https://www.elastic.co/kr/what-is/elasticsearch

데이터 색인과 텍스트 분석 : https://velog.io/@hanblueblue/Elastic-Search-3

엘라스틱 서치 개념과 구조 : https://twofootdog.tistory.com/53

ES의 세그먼트 : https://ksk-developer.tistory.com/34?category=778267

ES의 세그먼트에 대한 정리 : https://icarus8050.tistory.com/51


elasticsearch란?

텍스트, 숫자, 정형 및 비정형 데이터 등 모든 유형의 데이터를 위한 무료 검색 및 분석 엔진이다.

“분산”과 개방형이 특징이다.

간단한 REST API, 분산형, 속도, 호가장성으로 유명하다.

기본적으로 엘라스틱 서치는 수많은 종류의 컨텐츠를 색인할 수 잇다.

모든 검색 엔진의 시초는 루씬이다.

더그 커팅이 고안한 역색인(inverted index) 구조인 아파치 루씬을 기반으로 분산처리를 가능하게 한 아파치 솔라가 등장하며 검색엔진 시장을 장악했다. 그리고 루씬을 기반으로 한 엘라스틱 서치가 등장하여 검색 엔진 분야에서 지배적이다.

여기서 더그 커팅은 바로 아파치 하둡의 창시자이기도 하다. 아파치 하둡은 루씬 프로젝트의 일환으로 개발된 오픈 소스 웹 검색 엔진인 아파치 너치의 하부 프로젝트에서 시작했다.

즉 검색 엔진과 분산 처리 즉 대용량 데이터를 다루는 기술은 밀접하다고 볼 수 있다.

우선 검색 엔진은 웹 사이트를 크롤링하고 색인하는 복잡한 소프트웨어가 필요함은 물론 관리해야 하는 서버와 “데이터”가 많기 때문이다.