Data Engineering/Hive

[Linux/Hive] Apache Hive를 설치해보자

seoraroong 2024. 8. 22. 00:00

리눅스 환경에서 Apache Hive를 설치해보자.

 

Firefox에 접속해 다음 링크에 접속해 다운받을 hive 패키지를 우클릭해 링크를 복사해준다.

https://dlcdn.apache.org/hive/hive-3.1.3/

 

Index of /hive/hive-3.1.3

 

dlcdn.apache.org

 

 

- wget 명령어와 링크를 이용해 Hive 패키지를 다운로드 받기

 

- tar.gz 파일의 압축을 풀어준다

 

- apache-hive-3.1.3-bin 으로 된 파일 이름을 간단하게 apache-hive로 변경하기

 

Hive 환경 설정

- 템플릿 파일을 변경해서 hive-env.sh 파일을 만들기

 

- hive-env.sh 파일에 하둡 홈 경로 설정하기

gedit apache-hive/conf/hive-env.sh

 

 

- hive-site.xml 파일 설정하기

  -> 기존에 있던 core-site.xml의 내용을 hive-site.xml 파일로 copy 한다.

 

- Hive 홈 경로 설정하기 (bashrc 파일)

 

Derby 메타스토어 초기화

Apache Derby는 Java 기반의 관계형 데이터베이스로, Hive의 기본 메타스토어 데이터베이스로 사용할 수 있다.

Derby 데이터베이스는 Hive의 임베디드 메타스토어로 사용되며, 메타 데이터를 저장한다.

Hive를 처음 설치하고 설정할 때 Derby 메타스토어를 초기화 해 주어야 한다.