https://intrepidgeeks.com/tutorial/handle-hive-nulls
Hive는 사용 과정에서 NULL,''(빈 문자열)에 대한 판단과 식별이 불가피하다.Hive의 기본 하단 저장 빈 값은 다른 기존 데이터베이스와 다릅니다.
hive는 기본적으로 빈 값을 저장하는 규칙에 null을 적용
CREATE EXTERNAL TABLE null_test(
c1 int,
c2 string,
c3 int
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '|'
STORED AS TEXTFILE
NULL DEFINED AS ''
LOCATION '/dianshang/asiainfo/null_test';
<aside> 💡 즉 정리하자면, 빈값인 경우를 null로 인지하여서 null로 저장하는 경우가 있다. 즉 빈칸과 null을 정확하게 식별하지 못하기 때문에 발생.
</aside>