리눅스 환경에서 Apache Hive를 설치해보자.
Firefox에 접속해 다음 링크에 접속해 다운받을 hive 패키지를 우클릭해 링크를 복사해준다.
https://dlcdn.apache.org/hive/hive-3.1.3/
Index of /hive/hive-3.1.3
dlcdn.apache.org

- wget 명령어와 링크를 이용해 Hive 패키지를 다운로드 받기

- tar.gz 파일의 압축을 풀어준다

- apache-hive-3.1.3-bin 으로 된 파일 이름을 간단하게 apache-hive로 변경하기

Hive 환경 설정
- 템플릿 파일을 변경해서 hive-env.sh 파일을 만들기

- hive-env.sh 파일에 하둡 홈 경로 설정하기
gedit apache-hive/conf/hive-env.sh

- hive-site.xml 파일 설정하기
-> 기존에 있던 core-site.xml의 내용을 hive-site.xml 파일로 copy 한다.


- Hive 홈 경로 설정하기 (bashrc 파일)

Derby 메타스토어 초기화
Apache Derby는 Java 기반의 관계형 데이터베이스로, Hive의 기본 메타스토어 데이터베이스로 사용할 수 있다.
Derby 데이터베이스는 Hive의 임베디드 메타스토어로 사용되며, 메타 데이터를 저장한다.
Hive를 처음 설치하고 설정할 때 Derby 메타스토어를 초기화 해 주어야 한다.

'Data Engineering > Hive' 카테고리의 다른 글
| [Linux/Hive] 공공데이터 포털에서 데이터셋을 다운로드 받아 Hive에 적재해보자 (0) | 2024.08.22 |
|---|---|
| [Linux/Hive] Apache Hive에 대해 알아보자 (0) | 2024.08.22 |